Carlos Ramos Pacheco

UNIVERSIDAD TECNICA DE BABAHOYO

INTEGRANTES

Carlos Ramos

Jaime Magallanes

Yamally estrada

CATEDRA

Base de Conocimiento

CATEDRATICA

Narcisa Crespo

MYCIN

Es un sistema experto desarrollado a principios de los años 70 por Edward Shortliffe, en la Universidad de Stanford. Fue escrito en Lisp, e inicialmente estaba inspirado en Dendral, otro sistema experto que tuvo cierto éxito a finales de los años 60. Su principal función consistía en el diagnóstico de enfermedades infecciosas de la sangre; además, Mycin era capaz de “razonar” el proceso seguido para llegar a estos diagnósticos, y de recetar medicaciones personalizadas a cada paciente según su estatura, peso.

FUNCIONAMIENTO

El funcionamiento de Mycin se basaba principalmente en un sencillo motor de inferencia, que manejaba una base de conocimiento de aproximadamente unas 500 reglas. El programa capturaba las entradas a partir de una serie de preguntas (como por ejemplo, ¿Tiene el paciente molestias en el pecho?, o ¿Ha sido operado el paciente anteriormente?), que usualmente respondía el médico del paciente. Tras este proceso, Mycin mostraba la salida por pantalla, que consistía en una serie de posiblesenfermedades (ordenadas por su probabilidad asociada), la explicación del por qué de cada uno de estos diagnósticos, y una serie de recomendaciones sobre el tratamiento a seguir por el paciente. Para calcular la probabilidad de cada uno de los resultados, los autores desarrollaron una técnica empírica basada en factores de certeza.Estos factores de certeza se calculaban de tal manera que en función de unas evidencias se asigna a la hipótesis un factor de certeza.

Poco a poco Mycin fue cayendo en desuso, debido principalmente a alguna de las debilidades que el programa presentaba, y también, por cuestiones éticas y legales que surgían al volcar la responsabilidad de la salud de una persona a una máquina (por ejemplo, si Mycin se equivocaba en algún diagnóstico, ¿quién asumía la culpa, el programador o el médico?).

Machine Learning

Machine Learning supervisado y no supervisado

El Machine Learning se divide en dos áreas principales: aprendizaje supervisado y aprendizaje no supervisado. Aunque pueda parecer que el primero se refiere a la predicción con intervención humana y la segunda no, estos dos conceptos tienen más que ver con qué queremos hacer con los datos.

El objetivo del aprendizaje supervisado es hacer predicciones a futuro basadas en comportamientos o características que se han visto en los datos ya almacenados (el histórico de datos). El aprendizaje supervisado permite buscar patrones en datos históricos relacionando los todos campos con el campo objetivo. Por ejemplo, los correos electrónicos se etiquetan como “spam” o “legítimo” por parte de los usuarios. El proceso de predicción se inicia con un análisis de qué características o patrones tienen los correos ya marcados con ambas etiquetas. Se puede determinar, por ejemplo, que un correo spam es aquel que viene de determinadas direcciones IP, y además tiene una determinada relación texto/imágenes, y además contiene ciertas palabras, y además no hay nadie en el campo “Para:”, y además… Este sería tan solo uno de los patrones. Una vez determinados todos los patrones (esta fase se llama “de aprendizaje”), los correos nuevos que nunca han sido marcados como spam o legítimos se comparan con los patrones y se clasifican (se predice) como “spam” o legítimos” en función de sus características.

Por otro lado, el aprendizaje no supervisado usa datos históricos que no están etiquetados. El fin es explorarlos para encontrar alguna estructura o forma de organizarlos. Por ejemplo, es frecuente su uso para agrupar clientes con características o comportamientos similares a los que hacer campañas de marketing altamente segmentadas.

APRENDIZAJE O ENTRENAMIENTO

Es el proceso en el que se detectan los patrones de un conjunto de datos, el corazón del machine learning. Una vez identificados los patrones, se pueden hacer predicciones con nuevos datos que se incorporen al sistema.

Por ejemplo, los datos históricos de las compras de libros en una web online se pueden usar para analizar el comportamiento de los clientes en sus procesos de compra (títulos visitados, categorías, historial de compras…), agruparlos en patrones de comportamiento y hacer recomendaciones de compra a los clientes nuevos que siguen los patrones ya conocidos o aprendidos.

CONJUNTO DE DATOS

Es la materia prima del sistema de predicción. Es el histórico de datos que se usa para entrenar al sistema que detecta los patrones. El conjunto de datos se compone de instancias, y las instancias de factores, características o propiedades.

INSTANCIA, EJEMPLO O REGISTRO

Una instancia es cada uno de los datos de los que se disponen para hacer un análisis. Si se quiere predecir el comportamiento de los clientes de un servicio de telefonía, cada instancia correspondería a un abonado. Cada instancia, a su vez, está compuesta de características que la describen, como la antigüedad del cliente en la compañía, el gasto diario en llamadas, etc. En una hoja de cálculo, serían las filas.

CARACTERÍSTICA, ATRIBUTO, FACTOR, PROPIEDAD O CAMPO

Son los atributos que describen cada una de las instancias del conjunto de datos. Las denominaciones se usan indistintamente en función del autor y del contexto. En el caso de una cartera de clientes, estaríamos hablando del número de compras de cada cliente, antigüedad, si es seguidor en redes sociales, si se ha dado de alta en la newsletter, productos comprados… En una hoja de cálculo, serían las columnas.

INGENIERÍA DE FACTORES

Se trata del proceso previo a la creación del modelo de predicción en el que se hace un análisis, limpieza y estructuración de los campos de los datos. Este proceso es uno de los más importantes y más costosos del proceso de predicción. El objetivo es eliminar los campos que no sirven para hacer la predicción y organizarlos adecuadamente para que el modelo no reciba información que no le es útil y que podría provocar predicciones de poca calidad o confianza.

ÁRBOL DE DECISIÓN

Es el esqueleto del modelo de predicción que se suele representar en modo gráfico como un árbol en el que las ramas constituyen los patrones reconocidos en el proceso de aprendizaje. En las hojas de las ramas se situarían las predicciones para cada patrón.

CONFIANZA

Es la probabilidad de acierto que calcula el sistema para cada una de las predicciones.

REFERENCIAS

(González, 2014)

(http://es.wikipedia.org, 2015)