UNIVERSIDAD TECNICA DE BABAHOYO
INTEGRANTES
Carlos Ramos
Jaime Magallanes
Yamally estrada
CATEDRA
Base de Conocimiento
CATEDRATICA
Narcisa Crespo
MYCIN
Es un sistema experto desarrollado a principios de los años 70 por Edward Shortliffe, en la Universidad de Stanford. Fue escrito en Lisp, e inicialmente estaba inspirado en Dendral, otro sistema experto que tuvo cierto éxito a finales de los años 60. Su principal función consistía en el diagnóstico de enfermedades infecciosas de la sangre; además, Mycin era capaz de “razonar” el proceso seguido para llegar a estos diagnósticos, y de recetar medicaciones personalizadas a cada paciente según su estatura, peso.
FUNCIONAMIENTO
El funcionamiento de Mycin se basaba principalmente en un sencillo motor de inferencia, que manejaba una base de conocimiento de aproximadamente unas 500 reglas. El programa capturaba las entradas a partir de una serie de preguntas (como por ejemplo, ¿Tiene el paciente molestias en el pecho?, o ¿Ha sido operado el paciente anteriormente?), que usualmente respondía el médico del paciente. Tras este proceso, Mycin mostraba la salida por pantalla, que consistía en una serie de posiblesenfermedades (ordenadas por su probabilidad asociada), la explicación del por qué de cada uno de estos diagnósticos, y una serie de recomendaciones sobre el tratamiento a seguir por el paciente. Para calcular la probabilidad de cada uno de los resultados, los autores desarrollaron una técnica empírica basada en factores de certeza.Estos factores de certeza se calculaban de tal manera que en función de unas evidencias se asigna a la hipótesis un factor de certeza.
Poco a poco Mycin fue cayendo en desuso, debido principalmente a alguna de las debilidades que el programa presentaba, y también, por cuestiones éticas y legales que surgían al volcar la responsabilidad de la salud de una persona a una máquina (por ejemplo, si Mycin se equivocaba en algún diagnóstico, ¿quién asumía la culpa, el programador o el médico?).
Machine
Learning
Machine Learning supervisado y no
supervisado
El Machine
Learning se divide en dos áreas principales: aprendizaje supervisado y
aprendizaje no supervisado. Aunque pueda parecer que el primero se refiere a la
predicción con intervención humana y la segunda no, estos dos conceptos tienen
más que ver con qué queremos hacer con los datos.
El objetivo del aprendizaje supervisado es hacer predicciones a futuro
basadas en comportamientos o características que se han visto en los datos ya
almacenados (el histórico de datos). El aprendizaje supervisado permite buscar
patrones en datos históricos relacionando los todos campos con el campo
objetivo. Por ejemplo, los correos electrónicos se etiquetan como “spam” o “legítimo”
por parte de los usuarios. El proceso de predicción se inicia con un análisis
de qué características o patrones tienen los correos ya marcados con ambas
etiquetas. Se puede determinar, por ejemplo, que un correo spam es aquel que
viene de determinadas direcciones IP, y además tiene una determinada relación
texto/imágenes, y además contiene ciertas palabras, y además no hay nadie en el
campo “Para:”, y además… Este sería tan solo uno de los patrones. Una vez
determinados todos los patrones (esta fase se llama “de aprendizaje”), los
correos nuevos que nunca han sido marcados como spam o legítimos se comparan
con los patrones y se clasifican (se predice) como “spam” o legítimos” en
función de sus características.
Por otro lado, el aprendizaje no supervisado usa datos históricos que no
están etiquetados. El fin es explorarlos para encontrar alguna estructura o
forma de organizarlos. Por ejemplo, es frecuente su uso para agrupar clientes
con características o comportamientos similares a los que hacer campañas de
marketing altamente segmentadas.
APRENDIZAJE O
ENTRENAMIENTO
Es el proceso en el que se detectan los patrones de un conjunto de
datos, el corazón del machine learning. Una vez identificados los patrones, se
pueden hacer predicciones con nuevos datos que se incorporen al sistema.
Por ejemplo, los datos históricos de las compras de libros en una web
online se pueden usar para analizar el comportamiento de los clientes en sus
procesos de compra (títulos visitados, categorías, historial de compras…),
agruparlos en patrones de comportamiento y hacer recomendaciones de compra a
los clientes nuevos que siguen los patrones ya conocidos o aprendidos.
CONJUNTO DE DATOS
Es la materia prima del sistema de predicción. Es el histórico de datos
que se usa para entrenar al sistema que detecta los patrones. El conjunto de
datos se compone de instancias, y las instancias de factores, características o
propiedades.
INSTANCIA, EJEMPLO
O REGISTRO
Una instancia es cada uno de los datos de los que se disponen para hacer
un análisis. Si se quiere predecir el comportamiento de los clientes de un
servicio de telefonía, cada instancia correspondería a un abonado. Cada
instancia, a su vez, está compuesta de características que la describen, como
la antigüedad del cliente en la compañía, el gasto diario en llamadas, etc. En
una hoja de cálculo, serían las filas.
CARACTERÍSTICA,
ATRIBUTO, FACTOR, PROPIEDAD O CAMPO
Son los atributos que describen cada una de las instancias del conjunto
de datos. Las denominaciones se usan indistintamente en función del autor y del
contexto. En el caso de una cartera de clientes, estaríamos hablando del número
de compras de cada cliente, antigüedad, si es seguidor en redes sociales, si se
ha dado de alta en la newsletter, productos comprados… En una hoja de cálculo,
serían las columnas.
INGENIERÍA DE FACTORES
Se trata del proceso previo a la creación del modelo de predicción en el
que se hace un análisis, limpieza y estructuración de los campos de los datos.
Este proceso es uno de los más importantes y más costosos del proceso de
predicción. El objetivo es eliminar los campos que no sirven para hacer la
predicción y organizarlos adecuadamente para que el modelo no reciba
información que no le es útil y que podría provocar predicciones de poca calidad
o confianza.
ÁRBOL DE DECISIÓN
Es el esqueleto del modelo de predicción que se suele representar en
modo gráfico como un árbol en el que las ramas constituyen los patrones
reconocidos en el proceso de aprendizaje. En las hojas de las ramas se situarían
las predicciones para cada patrón.
CONFIANZA
Es la probabilidad de acierto que calcula el sistema para cada una de
las predicciones.
REFERENCIAS
(González, 2014)










