Entradas

Aplicación Práctica: K-Means (Aprendizaje No Supervisado)

Imagen
 Algoritmo de K-Means: El algoritmo de K-Means es un método de aprendizaje no supervisado que agrupa un conjunto de datos en k grupos basándose en sus características. Funciona de la siguiente manera: Inicialización: Selecciona k centroides iniciales de manera aleatoria. Asignación: Asigna cada punto de datos al centroide más cercano. Actualización: Calcula nuevos centroides como el promedio de los puntos asignados a cada cluster. Repetición: Repite los pasos 2 y 3 hasta que los centroides no cambien significativamente o se alcance un número máximo de iteraciones. Ejemplo de Aplicación: Segmentación de Clientes en Marketing Supongamos que tienes un conjunto de datos con información sobre clientes, como ingresos y gasto en productos. Queremos segmentar a los clientes en grupos para adaptar estrategias de marketing específicas a cada segmento. El codigo de acontinuación se tiene: # Importar bibliotecas import pandas as pd import matplotlib.pyplot as plt from sklearn.cluster impo...

Aplicación Práctica: Naive Bayes (Aprendizaje Supervisado)

Imagen
 Introducción.- El clasificador Naive  Bayes es un clasificador simple que se basa en el conocido teorema de Bayes. A pesar de su simplicidad, siguió siendo una opción popular para distintas aplicaciones, como ser: Clasificación de textos. Predicción multiclse. Filtrado de Spam Analisis de sentimiento entre otros.. Los modelos Naive Bayes son un grupo de algoritmos de clasificación extremadamente rápidos y simples que a menudo son adecuados para conjuntos de datos de muy alta dimensión. Debido a que son tan rápidos y tienen tan pocos parámetros ajustables, terminan siendo muy útiles. El algoritmo se llama ingenuo porque hace una suposición sobre la distribución de los datos. La distribución puede ser Gaussiana, Bernoulli o Multinomial.  El inconveniente de Naive Bayes es que las variables continuas tienen que ser preprocesadas y discretizadas por agrupamiento para las predicciones, lo que puede descartar información útil. Naive Bayes.- El clasificador Naive Bayes es apli...

Aplicación Práctica: Árboles de Decisión (Aprendizaje Supervisado)

Imagen
Árbol de Decisión.- Un árbol de decisión1​ es un modelo de predicción utilizado en diversos ámbitos que van desde la inteligencia artificial hasta la Economía. Dado un conjunto de datos se fabrican diagramas de construcciones lógicas, muy similares a los sistemas de predicción basados en reglas, que sirven para representar y categorizar una serie de condiciones que ocurren de forma sucesiva, para la resolución de un problema. Elementos de un Árbol de decisión.- Los árboles de decisión están formados por nodos, vectores de números, flechas y etiquetas. Cada nodo se puede definir como el momento en el que se ha de tomar una decisión de entre varias posibles, lo que va haciendo que a medida que aumenta el número de nodos aumente el número de posibles finales a los que puede llegar el individuo. Esto hace que un árbol con muchos nodos sea complicado de dibujar a mano y de analizar debido a la existencia de numerosos caminos que se pueden seguir. Los vectores de números serían la solución f...

Aplicación Práctica: Regresión Logística (Aprendizaje Supervisado)

Imagen
 Regresión Lógistica.- En estadística, la regresión logística es un tipo de análisis de clasificación utilizado para predecir el resultado de una variable categórica (una variable que puede adoptar un número limitado de categorías) en función de las variables independientes o predictoras. Es útil para modelar la probabilidad de un evento ocurriendo en función de otros factores. El análisis de regresión logística se enmarca en el conjunto de Modelos Lineales Generalizados (GLM por sus siglas en inglés) que usa como función de enlace la función logit. Las probabilidades que describen el posible resultado de un único ensayo se modelan como una función de variables explicativas, utilizando una función logística. La regresión logística es usada extensamente en las ciencias médicas y sociales. Otros nombres para regresión logística usados en varias áreas de aplicación incluyen modelo logístico, modelo logit, y clasificador de máxima entropía. La regresión logística analiza datos distribu...

Aprendizaje Automático (Introducción)

Introducción al Aprendizaje Automático:  Desentrañando los Misterios de la Máquina que Aprende El Aprendizaje Automático (AA) emerge como una disciplina fascinante en el ámbito de la inteligencia artificial, donde las máquinas tienen la capacidad de aprender y mejorar su rendimiento sin intervención humana directa. Este campo revolucionario busca desarrollar algoritmos y modelos que permitan a las computadoras extraer patrones y conocimientos a partir de datos, con el fin de realizar tareas específicas y mejorar su desempeño con el tiempo. Definición y Fundamentos Básicos: En esencia, el Aprendizaje Automático implica proporcionar a las máquinas la capacidad de aprender a partir de la experiencia, permitiéndoles adaptarse a situaciones nuevas sin programación explícita. Este proceso se basa en la idea de que las computadoras pueden identificar patrones y tomar decisiones sin intervención humana constante. Los fundamentos del AA se encuentran en la estadística, la teoría de la proba...

Aplicación Práctica: Regresión Lineal (Aprendizaje Supervisado)

Imagen
 Aplicación Práctica: Regresión Lineal (Aprendizaje Supervisado) Introducción algoritmo de regresión lineal: La regresión lineal es un algoritmo de aprendizaje supervisado utilizado para modelar la relación entre una variable dependiente (la variable que queremos predecir) y una o más variables independientes (características utilizadas para hacer la predicción). El objetivo es encontrar la mejor línea (en el caso de la regresión lineal simple) o hiperplano (en el caso de la regresión lineal múltiple) que minimice la diferencia entre las predicciones del modelo y los valores reales.La ecuación de la regresión lineal simple es de la forma:  $$y = mx + b$$ Donde: $y$ es la variable dependiente que se quiere predecir $x$ es la variable independiente $m$ es la pendiente de la línea $b$ es la ordenada al origen El objetivo es encontrar los valroes de $m$ y $b$  que minimicen la suma de los cuadrados de las diferencias entre las predicciones y los valores reales. El código se ...

Fundamentos Teóricos del aprendizaje Supervisado y No supervisado

Fundamentos Teóricos del Aprendizaje Supervisado y No Supervisado El aprendizaje automático, en su esencia, se puede clasificar en dos categorías principales: aprendizaje supervisado y no supervisado. Estas categorías reflejan diferentes enfoques para abordar la tarea de enseñar a un modelo a aprender patrones a partir de datos. Aprendizaje Supervisado: Conceptos Teóricos: En el aprendizaje supervisado, el modelo se entrena utilizando un conjunto de datos etiquetado. Es decir, cada ejemplo en el conjunto de datos de entrenamiento tiene una etiqueta o salida conocida asociada. El objetivo es que el modelo aprenda a mapear las entradas a las salidas correctas. El proceso de entrenamiento implica la optimización de los parámetros del modelo para minimizar la diferencia entre las salidas predichas y las etiquetas reales. Los algoritmos de aprendizaje supervisado se esfuerzan por generalizar a partir de los datos de entrenamiento, de modo que puedan realizar predicciones precisas sobre dato...