Solución para la detección de duplicados - Aquiles Solutions

Es habitual que en una base de datos de materiales se introduzca el mismo producto varias veces, con descripciones ligeramente distintas. Cuando la base de datos es extensa, con cientos de miles de elementos, resulta muy complicado detectar las entradas duplicadas, ya que una persona debe revisarlas una a una.

“Detección de Duplicados” es una aplicación que permite encontrar las entradas duplicadas en una base de datos mediante una comparación semántica de textos. La aplicación implementa un algoritmo especialmente diseñado para detectar similitudes en la descripción de dos materiales, estimando la probabilidad de que se trate del mismo producto.

El usuario puede entonces revisar una lista de candidatos que la aplicación considera duplicados, y confirmar aquellos casos en que realmente lo son. La aplicación va aprendiendo de las acciones del usuario y actualiza en tiempo real los parámetros.

Una vez que el análisis se ha completado, la lista de elementos duplicados puede exportarse para que el usuario pueda eliminarlos de la base de datos.

Beneficios

  • Permite encontrar entradas duplicadas en grandes bases de datos.
  • Los parámetros de similitud son cien por cien personalizables.
  • La aplicación se ejecuta en segundo plano, permitiendo al usuario seguir con su trabajo mientras se finaliza el análisis.

Indicadores

El programa permite analizar bases de datos de centenares de miles de entradas en pocas horas