Por favor, use este identificador para citar o enlazar este ítem: http://dspace.udla.edu.ec/handle/33000/15219
Tipo de material : masterThesis
Título : Aplicación de modelo de detección de anomalías Isolation Forest para la detección de reclamos fraudulentos en una compañía del sector de medicina prepagada
Autor : Rodríguez Salguero, Mateo Bernabé
Tutor : González Rodríguez, Mario Salvador
Palabras clave : DETECCIÓN DE ANOMALÍAS;CASOS DE FRAUDE;MEDICINA PREPAGADA;ANÁLISIS DE DATOS
Fecha de publicación : 2023
Editorial : Quito: Universidad de las Américas, 2023
Citación : Rodríguez, M. (2023). Aplicación de modelo de detección de anomalías Isolation Forest para la detección de reclamos fraudulentos en una compañía del sector de medicina prepagada (Tesis de maestría). Universidad de las Américas, Quito.
Resumen : El sector de medicina prepagada es uno de los que más riesgo de fraude presenta debido al giro mismo del negocio y a los riesgos presentes en la actualidad. Para las áreas de auditoría es complejo monitorear los reclamos que presentan los clientes, debido a esto, el uso de herramientas tecnológicas acompañadas de un correcto análisis de datos es imprescindible para tener un monitoreo sobre posibles casos de fraude. El uso de técnicas de Machine Learning ML para la detección de casos anómalos, que podrían considerarse fraude, es un enfoque que ha tenido crecimiento en diferentes sectores. Estás técnicas permiten la detección de patrones y pueden ser implementadas sin tener necesariamente etiquetas de casos fraudulentos. Al no tener etiquetas el enfoque de estudio puede ser tratado como un problema de aprendizaje no supervisado. Existen algoritmos especializados en detección de anomalías, como es Isolation Forest, que trabaja aislando los registros anómalos en función de variables relevantes. Para este caso de estudio se analizó los reclamos presentados por clientes durante los años 2021 al 2023 a una compañía de medicina prepagada. El objetivo de estudio es identificar posibles casos de fraude aplicando el algoritmo de Isolation Forest que analizará variables cuantitativas y cualitativas. Para la variable cualitativa del diagnóstico médico se empleó el algoritmo word2vec que permite vectorizar esta variable y aportar más información al modelo. Al implementar este tipo de algoritmos de ML las áreas de las empresas de seguros dedicadas al control mejorarán su gestión en prevención de fraudes en reclamaciones presentadas.
Descripción : The medical insurance sector is one of the areas that presents a higher risk of fraud due to the nature of the business itself and the current risks. For audit departments, monitoring customer claims is complex. Therefore, the use of technological tools along with proper data analysis is essential for monitoring potential fraud cases. The utilization of Machine Learning ML techniques for detecting anomalous cases, which could be considered fraud, has gained traction across various sectors. These techniques enable the identification of patterns and can be implemented without necessarily having labels for fraudulent cases. Without labels, the study approach can be treated as an unsupervised learning problem. There are specialized algorithms for anomaly detection, such as the Isolation Forest, which works by isolating anomalous records based on relevant variables. In this case study, customer claims submitted to a medical insurance company during the years 2021 2023 were analyzed. The study´s objective is to identify potential fraud cases by applying the Isolation Forest algorithm, which will analyze both quantitative and qualitative variables. For the qualitative variable of medical diagnosis, the word2vec algorithm was employed to vectorize this variable and provide more information to the model. By implementing such ML algorithms, the insurance company departments focused on control will enhance their fraud prevention management for submitted claims. This will contribute to an overall improvement in fraud prevention within the insurance sector.
URI : http://dspace.udla.edu.ec/handle/33000/15219
Aparece en las colecciones: Maestría Integral Negociación Ciencia de Datos

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
UDLA-EC-TMINCD-2023-07.pdf560,13 kBAdobe PDFVisualizar/Abrir


Este ítem está sujeto a una licencia Creative Commons Licencia Creative Commons Creative Commons