En el contexto actual, los hospitales y clínicas de Lima Metropolitana persisten deficiencias vinculadas a la calidad de la atención, muchas de las cuales no son detectadas a tiempo por falta de mecanismos que recojan y analicen de forma sistemática la experiencia del usuario. Como respuesta a esta necesidad, en esta investigación se propone un sistema de análisis de sentimientos mediante estrategias de minería de datos y procesamiento de lenguaje natural, el cual permitirá recolectar y analizar de forma automatizada reseñas públicas de usuarios disponibles en Google Reviews, orientada a descubrir información clave sobre la percepción del servicio. Para ello, se aplicó la metodología KDD (Knowledge Discovery in Databases), se implementó un flujo automatizado en la nube con servicios de AWS (Lambda y RDS), herramientas de scraping con APIFY y procesamiento de datos con Python, Pandas, NLTK y Transformers. Los resultados obtenidos fueron visualizados mediante dashboards interactivos en Power BI, que permitieron identificar patrones de satisfacción e insatisfacción clasificados a través de cinco dimensiones esenciales de la calidad: fiabilidad, capacidad de respuesta, seguridad, empatía y elementos tangibles. Este sistema ha demostrado ser una herramienta útil para transformar comentarios no estructurados en información valiosa, que apoya las decisiones fundamentadas en datos objetivos. La iniciativa busca contribuir mejoras sostenidas en la atención médica, integrando tecnología, automatización y la voz directa del paciente durante la etapa de evaluación del servicio.
In the current context, hospitals and clinics in Metropolitan Lima continue to suffer from deficiencies related to the quality of care, many of which are not detected in time due to a lack of mechanisms that systematically collect and analyze the user experience. In response to this need, this research proposes a sentiment analysis system using data mining and natural language processing strategies, which will enable the automated collection and analysis of public user reviews available on Google Reviews, with the aim of discovering key information about service perception. To this end, the KDD (Knowledge Discovery in Databases) methodology was applied, an automated flow was implemented in the cloud with AWS services (Lambda and RDS), scraping tools with APIFY, and data processing with Python, Pandas, NLTK, and Transformers. The results obtained were visualized using interactive dashboards in Power BI, which allowed us to identify patterns of satisfaction and dissatisfaction classified across five essential dimensions of quality: reliability, responsiveness, safety, empathy, and tangible elements. This system has proven to be a useful tool for transforming unstructured comments into valuable information that supports decisions based on objective data. The initiative seeks to contribute to sustained improvements in healthcare by integrating technology, automation, and the direct voice of the patient during the service evaluation stage.