El cáncer de mama es un tipo de cáncer que se desarrolla en las células de la mama. El tratamiento para el cáncer de mama generalmente implica rayos X, quimioterapia o una combinación de ambos tratamientos. Detectar el cáncer en una etapa temprana puede salvar la vida de una persona. La inteligencia artificial (IA) juega un papel muy importante en esta área. Por lo tanto, predecir el cáncer de mama sigue siendo un tema muy desafiante para los médicos e investigadores. Este trabajo tiene como objetivo predecir la probabilidad de cáncer de mama en pacientes. Utilizando modelos de aprendizaje automático (ML) como Multilayer Perceptron (MLP), K-Nearest Neightbot (KNN), AdaBoost (AB), Bagging, Gradient Boosting (GB) y Random Forest (RF). Se ha utilizado el conjunto de datos médicos de diagnóstico de cáncer de mama del repositorio de Wisconsin. El conjunto de datos incluye 569 observaciones y 32 características. Siguiendo la metodología de análisis de datos, se realizó limpieza de datos, análisis exploratorio, entrenamiento, pruebas y validación. El rendimiento de los modelos se evaluó con los parámetros: precisión de clasificación, especificidad, sensibilidad, recuento F1 y precisión. El entrenamiento y los resultados indican que los seis modelos entrenados pueden proporcionar resultados óptimos de clasificación y predicción. Los modelos RF, GB y AB lograron una precisión del 100%, superando a los demás modelos. Por lo tanto, los modelos sugeridos para la identificación, clasificación y predicción del cáncer de mama son RF, GB y AB. Asimismo, los modelos Bagging, KNN y MLP lograron un rendimiento del 99,56%, 95,82% y 96,92%, respectivamente. De manera similar, los tres últimos modelos lograron un rendimiento óptimo cercano al 100%. Finalmente, los resultados muestran una clara ventaja de los modelos RF, GB y AB, ya que logran.
https://repositorio.uwiener.edu.pe/bitstream/handle/20.500.13053/9106/Paper_72-Breast_Cancer_Prediction_using_Machine_Learning_Models.pdf?sequence=1&isAllowed=y