No hay diccionarios pa' eso

Buscando un diccionario de español para generar el léxico de eugnil, parece que no hay ninguno que se pueda usar fácilmente. Los datos del DLE, 93.111 entradas, son de uso restringido por las leyes de derecho de autor internacionales. Los datos del Wiktionary, 849.478 entradas, que también están restringidos por estas leyes, pero que se distribuyen con una licencia CC-BY-SA 3.0, tienen la dificultad de estar diseñados más para el consumo humano que para consumo robótico. [1]

Los datos del Wiktionary son atractivos, pero no tengo la habilidad para lidiar con esa complejidad. Además me molesta la idea de usar recursos distribuidos con copyright y licencias porque tampoco tengo recursos para lidiar con posibles problemas legales.

Como el copyright, las licencias y las patentes no hacen parte del futuro que yo me imagino, tal vez tenga que escribir el diccionario de eugnil desde cero y cederlo inmediatamente al dominio público.

[1]Ver el documento Very-large Scale Parsing and Normalization of Wiktionary Morphological Paradigms, de Christo Kirov et al, del Center for Language and Speech Processing, Johns Hopkins University Baltimore.

✮ Comentar ✮

Información de la entrada:

Autor

sirgazil

Temas