Ahora haciendo Data Mining con Microsoft SQL SERVER

miércoles, 12 de noviembre de 2014

Como buscar que usuario borro una row, table o base de datos SQL Server database

Aqui obtenermos un trace de las actividades que se realizaron en la base de datos PRUEBAS en donde primero buscamos el log.trc o el trace

SELECT path
FROM sys.traces
where id = 1

path
C:\Program Files\Microsoft SQL Server\MSSQL11.MSSQLSERVER\MSSQL\Log\log_109.trc

SELECT *
FROM fn_trace_gettable('C:\Program Files\Microsoft SQL Server\MSSQL11.MSSQLSERVER\MSSQL\Log\log_109.trc', 1)
WHERE DatabaseName ='PRUEBAS'
order by StartTime desc

miércoles, 19 de marzo de 2014

LAG (Transact-SQL)

Tiene acceso a datos de una fila anterior en el mismo conjunto de resultados sin el uso de una autocombinación en SQL Server 2012. LAG proporciona acceso a una fila en un desplazamiento físico especificado que hay antes de la fila actual. Use esta función analítica en una instrucción SELECT para comparar valores de la fila actual con valores de una fila anterior.

Sintaxis

LAG (scalar_expression [,offset] [,default])
    OVER ( [ partition_by_clause ] order_by_clause )

Argumentos

scalar_expression                                El valor que se va a devolver en función del desplazamiento especificado. Es una expresión de cualquier tipo que devuelve un único valor (escalar). scalar_expression no puede ser una función analítica. 
offset                                
El número de filas hacia atrás de la fila actual de la que se va a obtener un valor. Si no se especifica, el valor predeterminado es 1. offset puede ser una columna, una subconsulta u otra expresión que se evalúa como un entero positivo o que se puede convertir implícitamente en un tipo bigint. offset no puede ser un valor negativo o una función analítica. 
default                                
El valor que se va a devolver si scalar_expression en offset es NULL. Si no se especifica ningún valor predeterminado, se devuelve NULL. default puede ser una columna, una subconsulta u otra expresión, pero no puede ser una función analítica. default debe tener un tipo compatible con scalar_expression. 
OVER ( [ partition_by_clause ] order_by_clause)               
partition_by_clause divide el conjunto de resultados generado por la cláusula FROM en particiones a las que se aplica la función. Si no se especifica, la función trata todas las filas del conjunto de resultados de la consulta como un único grupo. order_by_clause determina el orden de los datos antes de que se aplique la función. Si se especifica partition_by_clause, determina el orden de los datos de la partición. Se necesita order_by_clause. Para obtener más información, vea OVER (cláusula de Transact-SQL).

USE AdventureWorks2012;
GO
SELECT BusinessEntityID, YEAR(QuotaDate) AS SalesYear, SalesQuota AS CurrentQuota,
LAG(SalesQuota, 1,0) OVER (ORDER BY YEAR(QuotaDate)) AS PreviousQuota
FROM Sales.SalesPersonQuotaHistory
WHERE BusinessEntityID = 275 and YEAR(QuotaDate) IN ('2005','2006');

BusinessEntityID SalesYear   CurrentQuota          PreviousQuota
---------------- ----------- --------------------- ---------------------
275              2005        367000.00             0.00
275              2005        556000.00             367000.00
275              2006        502000.00             556000.00
275              2006        550000.00             502000.00
275              2006        1429000.00            550000.00
275              2006        1324000.00            1429000.00

viernes, 6 de julio de 2012

SSAS 2008 OLAP - Excel Initialization of the data source failed

Desde un PC Cliente que solo tenia instalado office, tratando de conectarme a un cubo OLAP de Analysis Services tube un error que era el de Inicializacion de recursos fallidos

(Excel Initialization of the data source failed to SSAS 2008)

que tenia que mostrarme una ventana para volver a ingresar el password de la conexion al cubo olap, pero este no aparecia y me daba error

Como no tenia instalado nada lo que hace falta es las librerias de conexion que se puede obtener instalando la suite de sql server o el Microsoft SQL Server 2008 Service Pack 2 Feature Pack http://www.microsoft.com/en-us/download/details.aspx?id=6375 en el cual solo hace falta instalar el

SQLSERVER2008_ASOLEDB10.msi

18.9 MB ya que lo que esta fallando es la conexion

Es solo cuestion de instalar y listo.. va a estar antando y apareciendonos el cuadro de MultidimensionalConecction

miércoles, 19 de octubre de 2011

Tabular Modeling (SSAS) – Modo tabular Analysis Services SQL Server 2012

Instalando Denali (SQL SERVER 2012) Me encontre con la Configuracion de Analysis Services en donde tengo que elegir el SERVER MODE.. pero que opcion elijo?? Modo Multidimensional y Data Mining ya lo conocemos desde el 2005 pero lo nuevo es el Modo Tabular.

Los Modelos tabulares son las bases de datos en memoria de Analysis Services. Utilizando algoritmos de compresión y procesador de consultas de subprocesos múltiples, el motor de VertiPaq ™ ofrece acceso rápido a datos y objetos del modelo tabular informando de las aplicaciones de cliente, como Microsoft Excel y Microsoft Project.

Los modelos Tabulares soportan acceso a datos a través de dos modos: modo cachéd y el modo de DirectQuery.

- En el modo en caché, puede integrar datos de múltiples fuentes, incluyendo bases de datos relacionales, fuentes de datos y archivos de texto plano.

- En el modo de DirectQuery, puede saltarse el modelo de memoria, permitiendo a cliente aplicaciones para consultar los datos directamente en el origen (SQL Server relacionales).

Los Modelos tabulares son creados en Business Intelligence Development Studio utilizando plantillas de proyecto de nuevo modelo tabular. Se puede importar datos desde múltiples fuentes y, a continuación, enriquecer el modelo mediante la adición de las relaciones, las columnas calculadas, medidas, KPI y jerarquías. Los Modelos, pueden implementarse en una instancia de Analysis Services en aplicaciones de reporting del cliente que pueden conectarse a ellos. Implementado modelos pueden administrarse en SQL Server Management Studio al igual que los modelos multidimensionales. También puede ser divididas para su procesamiento optimizado y asegurando a nivel de fila mediante el uso de seguridad basado en roles.

En proximos post veremos lo que hace referencia a

Tabular Model Solutions (SSAS)

Tabular Model Databases (SSAS)

Tabular Model Data Access

miércoles, 5 de octubre de 2011

Tutoriales SQL SERVER 2008 R2

(http://msdn.microsoft.com/es-es/library/ms167593.aspx)

hago un copy & paste de esta pagina de SQL Server 2008 R2 ya que siempre se me pierde este link, la verdad que esta bueno tener esots tutoriales para cuando no tenemos claro algun tema.

Los tutoriales sirven de ayuda para conocer la nueva funcionalidad de SQL Server. En los Libros en pantalla de SQL Server, los tutoriales se han integrado en el contenido que está asociado a la tecnología de cada componente. Por ejemplo, los tutoriales que describen cómo diseñar e implementar los paquetes de Integration Services están bajo "Diseñar e implementar paquetes", en la sección Integration Services de los Libros en pantalla.

Para ayudarle a encontrar rápidamente las diversas secciones de tutoriales que están asociadas a la tecnología de cada componente, este tema muestra los tutoriales de SQL Server que están disponibles actualmente.

Para abrir una versión interactiva de este tema

En el menú Inicio, seleccione Programas, el grupo de programas de Microsoft SQL Server, Documentación y tutoriales, Tutoriales y, a continuación, haga clic en Tutoriales de SQL Server.

Tutoriales

Icono del motor de base de datos Database Engine (Motor de base de datos)

Tutoriales de herramientas de administración:

Tutorial: SQL Server Management Studio

Tutorial: utilidad sqlcmd

Tutorial: Asistente para la optimización de motor de base de datos

Tutorial: Administrar servidores mediante administración basada en directivas

Tutorial: evaluar las prácticas recomendadas con la administración basada en directivas

Tutoriales del motor de base de datos:

Tutorial: Introducción al motor de base de datos

Tutorial: Escribir instrucciones Transact-SQL

Tutorial: Uso del tipo de datos hierarchyid

Icono de Analysis Services Analysis Services: datos multidimensionales

Diseñar e implementar: tutoriales (Analysis Services - Datos multidimensionales): Utilice los tutoriales de esta sección para obtener información sobre cómo desarrollar soluciones de datos multidimensionales.

Icono de minería de datos Analysis Services: Minería de datos

Diseñar e implementar: tutoriales (Analysis Services - Minería de datos): Utilice los tutoriales de esta sección para obtener información sobre cómo desarrollar soluciones de minería de datos.
Tutoriales: usar DMX: Utilice los tutoriales de esta sección para obtener información sobre cómo crear consultas con los modelos de minería de datos para predecir tendencias, recuperar patrones en los datos y medir la exactitud de los modelos de minería de datos.

Icono de Integration Services Integration Services

Tutoriales para diseñar e implementar paquetes: Utilice los tutoriales de esta sección para obtener información sobre cómo crear paquetes en un proyecto de Integration Services y como guía para usar las herramientas de Integration Services.
Tutorial: Implementar paquetes: Use este tutorial para aprender a usar las herramientas de Integration Services con el fin de instalar los paquetes y sus dependencias en un equipo diferente.

Icono de replicación Replicación

Diseñar e implementar: tutoriales (replicación): Utilice los tutoriales de esta sección para obtener información sobre cómo utilizar SQL Server Management Studio para configurar y ejecutar las topologías de replicación.

Icono de Reporting Services Reporting Services

Tutorial: Cómo buscar e iniciar herramientas de Reporting Services: Use este tutorial para obtener información sobre cómo usar las herramientas que permiten configurar un servidor de informes, administrar las operaciones y el contenido del servidor de informes, y crear y publicar informes y modelos de informe.
Tutoriales (SSRS): Utilice los tutoriales de esta sección para obtener información sobre capacidades básicas de diseño de informes, paso a paso.
Tutoriales de diseño de modelos de informes: Use los tutoriales de esta sección para aprender los conocimientos necesarios para crear modelos que puede usar en el Generador de informes o el Diseñador de consultas de modelos de informe.
Guía del programador: Tutoriales (Reporting Services): Use los tutoriales de esta sección para aprender diferentes formas de desarrollar soluciones de Reporting Services.

Icono de Service Broker Service Broker

Tutoriales de Service Broker: Utilice los tutoriales de esta sección para obtener información sobre cómo crear conversaciones que permitan intercambiar mensajes entre las bases de datos.

jueves, 15 de septiembre de 2011

WINDOWS 8 instalacion ( Windows 8 installation )

Bueno despues de descargar instalar y jugar un poco con el preview de Windows8 aqui dejo algunas imagenes… tiene algunas innovaciones pero tambien sacaron algunas cosas… sera de seguir jugando un poco con el win 8 y pues creo que en verdad tiene el enfoque de Tablet ya que me hizo acuerdo mucho a mi Motorola XOOM. Lo malo como siempre en versiones previas es los drivers de la tarjeta de video o de la wifi… a continuacion dejo imagenes y copio lo del Windows Developer Preview downloads

Windows Developer Preview downloads

The Windows Developer Preview is a pre-beta version of Windows 8 for developers. These downloads include prerelease software that may change without notice. The software is provided as is, and you bear the risk of using it. It may not be stable, operate correctly or work the way the final version of the software will. It should not be used in a production environment. The features and functionality in the prerelease software may not appear in the final version. Some product features and functionality may require advanced or additional hardware, or installation of other software.

Windows Developer Preview with developer tools English, 64-bit (x64)

DOWNLOAD (4.8 GB)

Sha 1 hash - 6FE9352FB59F6D0789AF35D1001BD4E4E81E42AF

All of the following come on a disk image file (.iso). See below for installation instructions.

64-bit Windows Developer Preview
Windows SDK for Metro style apps
Microsoft Visual Studio 11 Express for Windows Developer Preview
Microsoft Expression Blend 5 Developer Preview
28 Metro style apps including the BUILD Conference app

Ahora si comenzo la inatalacion

Ya esta intalado y comenzamos a probarlo

Pantalla de bienvenida

Menu de inicio

El desktop de windows 8 en accion con los settings

SQL Server DENALI CTP3 Demo VHD

desde hace unas semanas esta disponible esta imagen de hyper V.. el link del Download Center es http://www.microsoft.com/download/en/details.aspx?id=27253 adjunto el detalle abajo

A Hyper-V image of SQL Server Denali CTP3 in action

Quick details

Version:	1.0	Date Published:	9/8/2011
Language:	English

Files in this download

The links in this section correspond to files available for this download. Download the files appropriate for you.

Overview

A HyperV image of SQL Server Denali CTP3 in action, including fully configured services and integration with SharePoint 2010 and Office 2010
The following software is configured on the virtual machine:

SQL Server "Denali" CTP3
SharePoint 2010
Office 2010

Top of page

System requirements

Supported Operating Systems: Windows Server 2008 R2 Enterprise, Windows Server 2008 R2 Standard

a Windows Server 2008R2 edition with Hyper-V role enabled.
Drive formatted to NTFS.
Processor: INTEL VT or AMD-V Capable
RAM: 8GB or more. Recommended 16GB+
Hard disk space required for install: 60GB

Top of page

Instructions

Setting up Hyper-V:

1. Install Hyper-V role on your Windows Server 2008R2 host (see: TechNet: Hyper-V guide for more info.)
2. Extract VM images by running the self-exrtracting executable "SQLServerCodeNameDenaliCTP3.part01.exe"
3. Open Hyper-V Manager
4. Under Actions, click Virtual Network Manager.
5. Choose New Virtual Network in the Virtual Networks pane
6. Choose Internal from the type list and click Add.
7. Enter a name of Internal network and click OK
8. Close the Virtual Network Manager dialog.

Importing the Virtual Machine

Due to the activation and expiration models in Windows Server 2008 and R2, it’s highly recommended that you do one of the following: Retain a copy of the unaltered VM or, Create and retain a snapshot from before first run of the VMs.
1. In Hyper-V Manager, under Actions, click Import Virtual Machine.
2. Use the Browse button to select the folder where the virtual machine package was extracted.
3. Click Import and wait for the Import to complete - the import status will appear in the Operations column.
4. Select the newly imported virtual machine and click Settings in the right pane of the Hyper-V Manager.
5. Confirm (and correct if necessary) that the Network Adapter is connected to the Internal network from the steps above.
6. Close the virtual machine Setting dialog.

Starting the VM:

1. Retutn to or start the Hyper-V Manager
2. Select the Virtual Machine that you just imported above
3. Click Start
4. Click Connect - a Vritual Machine Connection window should appear
5. Wait for the VM to boot up and and reach the login screen.
6. Login to the VM Image.

User: Contoso\Administrator
Password: pass@word1
Default Domain: CONTOSO

The Evaluation period for this Virtual Machine is 180-Days. By logging into the Virtual Machine you are accepted the EULA agreement contained within.

domingo, 11 de septiembre de 2011

Los días 31 de SSIS

Hace unos meses vi que en SQL Server Central ponian los links de un flaco que daba tips de SSIS en una seria llamada “31 dias de SSIS”

A continuación se presentan todos los post en esta serie y podrá ser actualizado cada día como salen los nuevos puestos.

miércoles, 31 de agosto de 2011

Infrastructure Planning and Design Microsoft® SQL Server® 2008 R2

Hace unos dias me vi en la situacion de planear una infraestructura para SSAS y encontre el IPD de SQL SERVER 2008. Esta guía describe el proceso de planificación de una infraestructura de SQL Server 2008 o SQL Server 2008 R2. La Guía se ocupa de las tareas y decisiones fundamentales siguientes:

• Identificar qué características de SQL Server se necesitarán.

• Decisiones de diseño relacionados con los componentes, el diseño y la conectividad de la infraestructura de SQL Server.

Siguiendo las instrucciones de esta guía se traducirá en un diseño que es de tamaño, configurado y colocado adecuadamente para ofrecer los beneficios del negocio, mientras también teniendo en cuenta el rendimiento, la capacidad y la tolerancia a errores del sistema.

Esta guía aborda los escenarios más probables a ser encontrado por alguien que va a diseñar una infraestructura de SQL Server. Los clientes deben considerar tener su arquitectura revisado por soporte y servicio al cliente de Microsoft antes de la aplicación como esa organización es mejor capaz de hacer un comentario sobre la compatibilidad de un diseño particular.

SQL Server 2008 incluye cuatro componentes principales que pueden ser implementados por separado o como un grupo para formar una plataforma de datos escalable:

• El motor de base de datos. El motor de base de datos es el servicio básico de almacenamiento, procesamiento y protección de datos.

• Servicios de integración. Microsoft SQL Server Integration Services (SSIS) es una plataforma para la creación de soluciones de integración de datos de orígenes heterogéneos, incluidos los paquetes que proporcionan el extracto, transformación y carga de procesamiento (ETL) para data warehousing.

• Servicios de análisis. Microsoft SQL Server Analysis Services (SSAS) soporta funcionalidades de minería de datos OLAP (procesamiento analítico en línea). Esto permite que un administrador de base de datos diseñar y crear estructuras multidimensionales que contienen datos de otras fuentes de datos, tales como bases de datos relacionales.

• Reporting Services. Microsoft SQL Server Reporting Services (SSRS) ofrece enterprise reporting funcionalidad para crear informes que recogen el contenido de una variedad de orígenes de datos, la publicación de los informes en varios formatos y administrar centralmente sus suscripciones y seguridad.

Además, SQL Server 2008 R2 introduce un quinto componente:

• Servicios de datos Master. Master Data Services es una aplicación de administración (MDM) de datos maestros de componentes de plataforma que se pueden implementar como una aplicación o extendidos por el uso de los componentes de plataforma constantemente definir y administrar las entidades de datos críticos de una organización. Master Data Services es un concentrador de cualquier dominio que admite, pero no se limita a dominios tales como producto, cliente, ubicación, centro de coste, equipo, empleados y proveedores.

Para los lectores que no podrían estar familiarizados con la funcionalidad de distintos de los servicios de base de datos del núcleo, la figura 1 ilustra un posible conjunto de relaciones entre los componentes que pueden constar de una infraestructura de SQL Server 2008. Tenga en cuenta que la cifra no ofrece una mirada comprensiva en absoluto rutas de datos posibles; es una representación única con fines ilustrativos.

La figura 1. Ejemplo de una posible infraestructura de SQL Server

Para proporcionar una perspectiva sobre cómo los diferentes componentes de SQL Server complementan entre sí, un posible escenario (pasos 1-6) está representado por encima y se describe a continuación:

1. Aplicación toma de entrada de los usuarios y escribe las entradas a una base de datos OLTP como ocurre.

2. Periódicamente, SQL Server Integration Services (SSIS) extrae los datos de la base de datos OLTP, combina con otros datos existentes en la organización (tal vez otro sistema de base de datos o algunos pisos exportación de archivos de sistemas heredados). SSIS luego transforma los datos, estandariza los formatos de los datos, por ejemplo, nombres de abreviaturas del Estado — y, a continuación, carga los datos en otra base de datos — en este caso, un almacén de datos de SQL Server.

3. SQL Server Analysis Services (SSAS) se utiliza para extraer datos del data warehouse y colocar en cubos OLAP. Cubos permitan consultas complejas analíticas y según sea necesario con un rápido tiempo de ejecución.

4. Gestión de toma de decisiones puede utilizar software de hoja de cálculo de Microsoft Excel ® u otras aplicaciones para realizar minería de datos para detectar y predecir las tendencias en el negocio.

5. SQL Server Reporting Services (SSRS) se utiliza para publicar informes a otros usuarios de la organización, por ejemplo, los vendedores que necesitan conocer los niveles de producción actuales. Estos informes se generan bajo demanda o de manera programada.

6. Master Data Services es una aplicación de administración de datos maestros utilizada sistemáticamente definir y administrar las entidades de datos críticos de una organización.

EL LINK ES http://technet.microsoft.com/en-us/solutionaccelerators/ee424434

martes, 30 de agosto de 2011

Lift Chart (SQL SERVER 2008 Analysis Services - Data Mining)

En la pagina de Microsoft msdn el tutorial de DataMining de AdventureWorks indica el Testing Accuracy con LiftChart pero la explicacion mas detallada del LiftChart es la siguiente (http://msdn.microsoft.com/en-us/library/ms175428(v=sql.100).aspx):

Se puede ver diferentes tipos de gráficos en la ficha Gráfico Lift de la ficha Gráfico de Accuracy de minería de datos del Diseñador de minería de datos, dependiendo del modelo que seleccione, del atributo predecible del modelo y de otras configuraciones.

Si su modelo predice un valor discreto, puede crear un gráfico de elevación o un gráfico de beneficios. Un gráfico de elevación compara la precisión de las predicciones de cada modelo y se puede configurar para mostrar la precisión de las predicciones en general o de las predicciones para un valor concreto. Un gráfico de beneficios es un tipo de gráfico relacionado que contiene la misma información que un gráfico de elevación, pero también muestra el aumento proyectado en la ganancia que se asocia al uso de modelo. Use la lista Tipo de gráfico para seleccionar el tipo de gráfico que desea.

Nota No puede mostrar los modelos de serie temporal en un gráfico de elevación o en un gráfico de beneficios, pero puede ver un gráfico que contenga las series históricas y las predicciones basándose en la serie mediante la ficha Predicción de modelo de minería de datos. Para obtener más información, vea Algoritmo de serie temporal de Microsoft.

Para obtener más información: Profit Chart (Analysis Services - Data Mining), Scatter Plot (Analysis Services - Data Mining) Gráfico de beneficios (Analysis Services - Minería de datos) , Gráfico de dispersión (Analysis Services - Minería de datos)

Escenario

La ficha Gráfico de Lift muestra una representación gráfica del cambio en la elevación que provoca un modelo de minería de datos. Por ejemplo, el departamento de marketing de Adventure Works Cycles desea crear una campaña de distribución de correo directo. Por las campañas anteriores, saben que el índice de respuesta típico es de un 10 por ciento. Tienen una lista de 10.000 clientes potenciales almacenada en una tabla de la base de datos. Por lo tanto, según el índice típico de respuesta, pueden esperar que respondan 1.000 clientes potenciales.

Sin embargo, el dinero presupuestado para el proyecto no es suficiente para llegar a los 10.000 clientes de la base de datos. Basándose en el presupuesto, pueden permitirse enviar publicidad por correo a sólo 5.000 clientes. El departamento de marketing tiene dos opciones:

Seleccionar aleatoriamente 5.000 clientes como objetivo
Usar un modelo de minería de datos para dirigirse a los 5.000 clientes con mayores probabilidades de respuesta

Si la compañía selecciona de forma aleatoria 5.000 clientes, pueden esperar recibir sólo 500 respuestas, según la tasa de respuesta típica. La línea aleatoria del gráfico de elevación representa esta situación. Sin embargo, si el departamento de marketing usa un modelo de minería de datos para dirigir la distribución de correo, puede esperar un mayor índice de respuesta ya que se orienta a los clientes que tienen más probabilidades de responder. Si el modelo es perfecto, significa que el modelo crea predicciones infalibles y que la empresa podría esperar recibir 1.000 respuestas mediante una distribución de correo de los 1.000 clientes potenciales que recomienda el modelo. La línea ideal del gráfico de elevación representa esta situación. La realidad es que el modelo de minería de datos probablemente se sitúa entre estos dos extremos, entre una estimación aleatoria y una predicción perfecta. Cualquier mejora en la estimación aleatoria se considera una elevación.

Descripción del gráfico Lift

Puede crear dos tipos de gráficos de elevación: uno en el que se especifique un valor de destino para la columna de predicción y otro en el que no se especifique el valor. Cuando pasa de la ficha Selección de entrada a la ficha Gráfico de elevación, el gráfico se actualiza para reflejar los cambios realizados en las asignaciones de columnas o en otras configuraciones.

Gráfico Lift con valor de Target

El gráfico siguiente muestra un gráfico de elevación para el modelo Targeted Mailing que se crea en Tutorial básico de minería de datos. En este gráfico, el atributo de destino es [Bike Buyer] y el valor de destino es 1, lo que significa que el cliente compró una bicicleta o que es probable que lo haga. El gráfico de elevación muestra así la mejora que el modelo proporciona al identificar a los clientes que es probable que compren una bicicleta.

Además del modelo básico, el gráfico incluye un modelo relacionado filtrado para orientarse a clientes concretos. Puede agregar varios modelos a un gráfico de elevación, siempre que los modelos tengan todos el mismo atributo de predicción. Este filtro restringe los casos que se usan tanto en el entrenamiento como en la evaluación a los clientes menores de 30 años. Como resultado, el número de casos con los que el modelo se evalúa difiere para el modelo básico y para el modelo filtrado. Es importante recordar este punto al interpretar los resultados de predicción y otras estadísticas.

gráfico de elevación en el que se muestran dos modelos

El eje X del gráfico representa el porcentaje del conjunto de datos de prueba que se usa para comparar las predicciones. El eje Y del gráfico representa el porcentaje de valores de predicción.

La línea recta diagonal, mostrada aquí en azul, aparece en cada gráfico. Representa los resultados de la estimación aleatoria y es la línea base con la que evaluar la elevación. Con cada modelo que agrega a un gráfico de elevación, obtiene dos líneas adicionales: una muestra los resultados ideales para los datos de entrenamiento establecidos, si pudiera crear un modelo que siempre predijera perfectamente; y la segunda línea muestra la elevación real, o mejora en los resultados, para el modelo.

En este ejemplo, la línea ideal para el modelo filtrado se muestra en azul marino y la línea para la elevación real en amarillo. Puede deducir del gráfico que la línea ideal alcanza el máximo cerca del 40 por ciento, lo que significa que si tuviera un modelo perfecto, podría llegar al 100 por ciento de los clientes de destino enviando correo únicamente al 40 por ciento de la población total. La elevación real para el modelo filtrado al destinarse al 40 por ciento de la población está entre el 60 y el 70 por ciento, lo que significa que se podría llegar al 60 ó 70 por ciento de los clientes de destino enviando correo al 40 por ciento de la población total de clientes.

La Leyenda de minería de datos contiene los valores reales de cualquier punto de las curvas. Puede cambiar el lugar que se mide haciendo clic en la barra gris vertical y moviéndola. En el gráfico, la línea gris se ha movido al 30 por ciento, porque se trata del punto donde tanto el modelo filtrado como el modelo sin filtrar parecen ser más eficientes, y después de este punto la cantidad de elevación decae.

La Leyenda de minería de datos también contiene puntuaciones y estadísticas que ayudan a interpretar el gráfico. Estos resultados representan la exactitud del modelo en la línea gris, que en este escenario se determina para incluir el 30 por ciento de los casos de prueba totales.

Serie, Modelo	Puntuación	Población de destino	Probabilidad de predicción
Correo destinado a todos	0.71	47.40%	61.38%
Correo destinado a menores de 30	0.85	51.81%	46.62%
Modelo de estimación aleatoria		31.00%
Modelo ideal para: correo destinado a todos		62.48%
Modelo ideal para: correo destinado a menores de 30		65.28%

En estos resultados puede ver que, cuando se mide en el 30 por ciento de todos los casos, el modelo general (correo destinado a todos) puede predecir el comportamiento de compra de bicicletas en el 47,40% de la población de destino. En otras palabras, si enviara correo directo sólo al 30 por ciento de los clientes de la base de datos, podría llegar a algo menos de la mitad de los destinatarios pretendidos. Si utilizara el modelo filtrado, podría llegar aproximadamente al 51 por ciento de los clientes de destino.

El valor de Probabilidad de predicción representa el umbral necesario para incluir un cliente entre los casos "con probabilidad de comprar". Para cada caso, el modelo calcula la exactitud de cada predicción y almacena ese valor, que puede utilizar para filtrar o elegir clientes. Por ejemplo, para identificar los clientes del modelo básico que son compradores probables, utilizaría una consulta para recuperar los casos con una probabilidad de predicción de al menos el 61 por ciento. Para obtener los clientes de destino del modelo filtrado, crearía una consulta que recuperara los casos que cumplieran todos los criterios: la edad y un valor de PredictProbability de al menos el 46 por ciento.

Es interesante comparar los modelos. El modelo filtrado parece capturar más clientes potenciales, pero al elegir a los clientes con una puntuación de probabilidad de predicción del 46 por ciento, también tiene una posibilidad del 53 por ciento de enviar correo a alguien que no va a comprar una bicicleta. Por consiguiente, si estuviera decidiendo qué modelo es mejor, sería conveniente equilibrar la mayor precisión y el menor tamaño de destino del modelo filtrado con respecto a la capacidad de selección del modelo básico.

El valor de Puntuación ayuda a comparar los modelos calculando la efectividad del modelo a través de una población normalizada. Una mayor puntuación es mejor, de modo que en este caso podría decidir que seleccionar a los clientes menores de 30 años es la estrategia más eficiente, a pesar de la menor probabilidad de predicción.

Gráfico Lift para un modelo sin valor de target

Si no especifica el estado de la columna de predicción, puede crear el tipo de gráfico que se muestra en el diagrama siguiente. Este gráfico muestra el modo en que el modelo se comporta para todos los estados del atributo de predicción. Por ejemplo, este gráfico le indicaría hasta qué punto el modelo predice bien tanto los clientes que es probable que compren una bicicleta como los que no es probable que la compren.

El eje X es el mismo que en el gráfico con la columna de predicción especificada, pero ahora el eje Y representa el porcentaje de predicciones correctas. Por consiguiente, la línea ideal es la línea diagonal, que muestra que en el 50 por ciento de los datos, el modelo predice correctamente el 50 por ciento de los casos, el máximo que se puede esperar.

Gráfico de elevación en el que se muestran predicciones correctas

Puede hacer clic en el gráfico para mover la barra gris vertical y la Leyenda de minería de datos muestra el porcentaje de casos total y el porcentaje de casos que se predijeron correctamente. Por ejemplo, si coloca la barra deslizante gris en la marca del 50 por ciento, la Leyenda de minería de datos muestra las puntuaciones de precisión siguientes. Estas cifras se basan en el modelo TM_Decision Tree creado en el Tutorial básico de minería de datos.

Serie, Modelo	Puntuación	Población de destino	Probabilidad de predicción
TM_Decision Tree	0.77	40.50%	72.91%
Modelo ideal		50.00%

En esta tabla se indica que, en el 50 por ciento de la población, el modelo que creó predice correctamente el 40 por ciento de los casos. Podría considerar este un modelo bastante preciso. Sin embargo, recuerde que este modelo determinado predice todos los valores del atributo de predicción. Por consiguiente, el modelo podría ser preciso para predecir que el 90 por ciento de los clientes no comprarán una bicicleta.