spaCy

De Wikipedia, la enciclopedia libre
SpaCy
Información general
Tipo de programa software libre y de código abierto
Desarrollador Matt Honnibal
Lanzamiento inicial febrero de 2015
Licencia Licencia MIT
Información técnica
Programado en Python
Versiones
Última versión estable 3.7.415 de febrero de 2024
Enlaces

spaCy (pronunciación en inglés: [speɪˈsiː]) es una librería de software para procesamiento de lenguajes naturales, reconocimiento de nombres de entidades, análisis de redes, visualización de datos, análisis, visual analysis, análisis de contenidos, enriching, anotación desarrollado por Matt Honnibal y programado en lenguaje Python. Fue lanzado en febrero de 2015 estando su desarrollo activo y siendo utilizado en distintos entornos.

Es software libre con Licencia MIT su repositorio se encuentra disponible en Github.

Características principales[editar]

  • Tokenización no destructiva
  • Compatibilidad con tokenización alfa para más de 65 idiomas[1]
  • Soporte integrado para componentes de canalización entrenables, como reconocimiento de entidades nombradas, etiquetado de parte de la voz, análisis de dependencias, clasificación de texto, vinculación de entidades, entre otros
  • Modelos estadísticos para 17 idiomas
  • Aprendizaje multitarea con transformadores previamente entrenados como BERT
  • Compatibilidad con modelos personalizados en PyTorch, TensorFlow y otros marcos

Usos[editar]

El software IA2[2]​ utiliza el motor de spaCy para realizar análisis de fallos judiciales con el objetivo de generar anonimato de cierta información.

Referencias[editar]

Enlaces externos[editar]