« Tuno Negro / 殺しのセレナーデ | Main | en directo インターネットラジオ・TV »

Thursday, May 13, 2004

corpus del español コーパス

スペイン語のコーパスをいくつかMEMOしとこう。私もお気に入りに入れてはいるが使いこなしてるとは到底言えない。

corpus del español
This 100 million word corpus of Spanish texts has been funded by the NEH and has been created by Prof. Mark Davies of Brigham Young University. In addition to being very fast, the search engine allows a wider range of searches than almost any other large corpus in existence. Please select a topic to the left for more help.

Este corpus de 100.000.000 palabras ha sido patrocinado por el NEH en 2001-02 y ha sido creado por el Prof. Mark Davies de la Universidad de Brigham Young. Además de ser muy rápido, el motor de búsquedas permite más tipos de búsquedas que casi cualquier otro corpus grande. Por favor, escoja un tema a la izquierda para más ayuda.

(加筆↓)
上述のMark Daviesという先生のセミナーだって(SEMINARIO DE LINGÜÍSTICA DEL CORPUS DEL ESPAÑOL)。タイムリー。
上智大学国際言語情報研究所申し込む。っつったってこれはあれだろ?センセイたちのセミナーだら? とりあえずMEMO。


Real Academia Española - Corpus Diacrónico del Español (CORDE)
La parte histórica, el CORDE (Corpus diacrónico -通時て何- del español), consta ahora de 180 millones de formas. Además del considerable incremento del volumen de textos, la nueva versión ha sustituido algunas ediciones por otras más adaptadas a los niveles de calidad habituales en las ediciones actuales. Además, los textos compuestos han sido fragmentados, de modo que las indicaciones generales de fecha son ahora las correspondientes a cada uno de los documentos. Por último, los textos en verso se muestran en la pantalla de párrafo en el formato más habitual.

Real Academia Española - Corpus de Referencia del Español Actual (CREA)
La nueva versión del CREA (Corpus de referencia del español actual) incorpora unos veinte millones de palabras pertenecientes a la nueva etapa del proyecto, la correspondiente al período 2000-2004. Con la adición de estos textos recientes, el CREA alcanza unos 140 millones de formas.

el paisのCORDEとCREAについての記事(2001?)によると、「el primero sobre el léxico español hasta 1975, y el segundo, del léxico posterior a dicha fecha.(前者が1975年までの用語、後者がそれ以降)」とな。

el mundoの記事(1998?)では:
Dicho corpus recoge los últimos 25 años, desde 1975 a 1999, mientras que las palabras que abarquen desde los inicios del idioma hasta el año 1975 están contenidas en el Corpus Diacrónico del Español (CORDE), dividido en tres grandes etapas: Edad Media, Siglos de Oro y Epoca Contemporánea, con la inclusión de textos poéticos, por ahora no contemplados en el CREA por su carácter especial.

(CORDEは1975年まで。中世・黄金世紀(16-17世紀; スペインの文学・美術の最盛期)・近現代と3段階に分かれてる。CREAは1975〜。)


他にも調べればあるのかもだけど、取り急ぎこれだけメモ。


で、何をホントはメモに来たんだっけ? なんか小咄を書こうと思って来たんだけどな。こんな小難しいことを書きに来たわけじゃなかったんだけどな。何だったかな。あー、いいや、あとはあとで。

ヤバいヤバい。ちょっとMEMOりに来ただけでこんなにあちこち調べさせられる(←誰によ、誰に?)とは。blogの中には時間どろぼうが居やがりますね?

ハッ。もうこんな時間かよ。夕方までに仕上げるなんて無理、無理だよ。

|

« Tuno Negro / 殺しのセレナーデ | Main | en directo インターネットラジオ・TV »

Comments

The comments to this entry are closed.