Stanford CoreNLP
La Suite Core PNL de la Universidad de Stanford es un marco de herramientas bajo licencia GPL para el procesamiento de textos en Inglés, chino y español. Incluye herramientas para “tokenización” (división del texto en palabras), parte del discurso de marcado, análisis gramatical (identificar elementos como sustantivos y frases verbales), reconocimiento de entidades, frases y dependencias de palabras, indican que sustantivo se refieren a las mismas entidades, etc. Stanford CoreNLP es un marco integrado. Su objetivo es hacer que sea muy fácil de aplicar un montón de herramientas de análisis lingüístico a un texto. Está diseñado para ser altamente flexible y extensible. incluyendo un etiquetador del discurso (POS), reconocedor entidad (NER), analizador, sistema de resolución del discurso, análisis de los sentimientos, y patrón bootstrapped