79 votos

¿Cómo recuperar el Wikcionario palabra contenido?

¿Cómo puede ser usada API de Wikcionario para determinar si existe o no una palabra?

58voto

Michael Mrozek Puntos 44120

El Wikcionario API puede ser utilizada para la consulta de si es o no una palabra.

Ejemplos existentes y no existentes páginas:

http://en.wiktionary.org/w/api.php?action=query&titles=test http://en.wiktionary.org/w/api.php?action=query&titles=testx

El primer enlace se ofrece ejemplos en otros tipos de formatos que pueden ser más fáciles de analizar.

Para recuperar la palabra de datos en un pequeño formato XHTML (en caso de más de la existencia de ser necesario), solicitar la versión para imprimir de la página:

http://en.wiktionary.org/w/index.php?title=test&printable=yes http://en.wiktionary.org/w/index.php?title=testx&printable=yes

Estos pueden ser analizados con cualquier estándar XML parser.

22voto

hippietrail Puntos 4257

Hay un par de advertencias en sólo la comprobación de que Wikcionario tiene una página con el nombre que está buscando:

Advertencia #1: Todos los Wiktionaries incluyendo el inglés Wikcionario en realidad, el objetivo de la inclusión de cada palabra en cada idioma, así que si usted simplemente uso por encima de llamada a la API, usted sabrá que la palabra que usted está preguntando acerca de la palabra al menos en una lengua, pero no necesariamente en inglés: http://en.wiktionary.org/w/api.php?action=query&titles=dicare

Advertencia #2: tal vez una redirección existe de una palabra a otra palabra. Podría ser desde una ortografía alternativa, pero podría ser a partir de un error de algún tipo. La llamada a la API anterior no diferenciar entre una redirección y un artículo: http://en.wiktionary.org/w/api.php?action=query&titles=profilemetry

Advertencia #3: Algunos Wiktionaries incluyendo el inglés Wikcionario incluyen "errores comunes": http://en.wiktionary.org/w/api.php?action=query&titles=fourty

Si estos no están incluidos en lo que usted desea, usted tendrá que cargar y analizar el wikitext sí mismo, que no es una tarea trivial.

19voto

kybernetikos Puntos 3127

Puede descargar un volcado de datos Wikitionary. Hay más información en la FAQ. Para sus propósitos, el volcado de las definiciones es probablemente una mejor opción que el volcado de xml.

7voto

benroth Puntos 431

Para mantenerlo simple, extraiga las palabras de la descarga así:

bzcat pages-articles.xml.bz2 | grep '<title>[^[:space:][:punct:]]*</title>' | sed 's:.*<title>\(.*\)</title>.*:\1:' > words

1voto

arek Puntos 9

Deberías probar JWKTL. Acabo de enterarme de ello ;)

http://en.wikipedia.org/wiki/Ubiquitous_Knowledge_Processing_Lab#wiktionary _API

http://www.UKP.tu-Darmstadt.de/software/jwktl/

Iteramos.com

Iteramos es una comunidad de desarrolladores que busca expandir el conocimiento de la programación mas allá del inglés.
Tenemos una gran cantidad de contenido, y también puedes hacer tus propias preguntas o resolver las de los demás.

Powered by:

X