Karabela projekts: mākslīgais intelekts, lai atklātu Spānijas vēstures noslēpumus

Karabela projekts: mākslīgais intelekts, lai atklātu Spānijas vēstures noslēpumus


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Mākslīgais intelekts (AI) un mašīnmācīšanās (ML) vēsturnieku dienestākopā ar algoritmiem, kas atrod dokumentus, kas ļoti interesē Spānijas vēsturi. Aiz tā ir Carabela projekts, projektu, kuru pēdējos divos gados izstrādāja Valensijas Politehniskās universitātes (UPV) un Andalūzijas Vēstures mantojuma institūta Zemūdens arheoloģijas centra pētnieki.

Šajā kontekstā viņi ir izstrādājuši un piemērojuši jaunas AI / ML metodes kas ļauj piekļūt vairāk nekā 130 000 attēlu saturam no Indijas Vispārējā arhīva un Kadisas provinces vēstures arhīva. Projekts ir saņēmis atbalstu no BBVA fonda palīdzības programmas zinātnisko pētījumu komandām digitālo humanitāro zinātņu jomā.

“Izmantojot šīs metodes, mēs varam izsekot jebkuram grafiskam dokumentam ar tādu pašu ātrumu kā tīmekļa meklētājprogramma, identificējot konkrētus vārdus, vārdu kombinācijas, frāzes utt. Tas viss pateicoties statistikas modeļiem, kurus esam apmācījuši no piemēriem un kuri tagad ir lielie sabiedrotie šo kolekciju izpētei Spānijas vēsturē. Tās pašas metodes var piemērot arī daudziem citiem vēsturiskiem dokumentiem, ”uzsver Enrike Vidals, UPV Pattern Recognition and Human Language Technologies (PRHLT) pētnieks.

Indijas Vispārējais arhīvs

The Indijas Vispārējā arhīva fondi Viņi ir ārkārtīgi ieinteresēti izpētīt Spānijas vēsturi Amerikā - sākot no ASV dienvidiem līdz Tierra de Fuego- un Filipīnām 15. – 19. Gadsimtā.

Ir par rokraksti, kas saistīti ar Spānijas jūras braucieniem un tirdzniecību, kuru analīzi nevar veikt ar tradicionālajām OCR transkripcijas metodēm - jo tās paredzētas drukātam tekstam -, ne ar īpašām metodēm rokraksta materiāliem, jo ​​to piedāvātie rezultāti, lietojot šos vēsturiskos tekstus, ir pārāk neprecīzi.

"Carabela ir ļāvis mums iet tālāk, izmantojot automātiskas mācīšanās metodes, kas ļauj indeksēt ar roku rakstīta teksta attēlus lielos vēsturisko dokumentu krājumos, kuru saglabāšanas stāvoklis un savīti rakstīšanas stili cilvēkiem gandrīz neiespējami lasīt viņu dokumentus," saka Džoana Andreu. Sančess, arī PRHLT-UPV pētnieks.

Šie paņēmieni spēj identificēt un atšķirt dažādos izmantotos burtus katrā no periodiem, kuros dokumenti ir datēti, un pat analizē attēlus, kuru kvalitāte ir ļoti zema.

Galvenais ir tā algoritmu kapacitāte iegūt modeļus, kurus automātiski “iemācās” no piemēriem.

“Lai iegūtu ļoti apmierinošus rezultātus, šādiem modeļiem ir nepieciešams salīdzinoši neliels mācību datu daudzums. Šīs metodes ļauj mums apmierinoši reaģēt uz izaicinājumiem, ko rada paši dokumenti, piemēram, pareizrakstības atšķirības, plankumi vai attēla kvalitāte. ”, Piebilst Vidals.

Šajā gadījumā, mācības tika veiktas ar apmēram 500 lappusēm no Archivo de Indias, kuras atlasīja un pārrakstīja Karloss Alonso un viņa Zemūdens arheoloģijas centra speciālistu komanda.

Vraki un Austrālija

Caravel ir izgājis gaismā rokraksta informācija par drupām kas veido pirmā lieluma arheoloģisko mantojumu, jo tā saturam ir liela vēsturiskā un kultūras bagātība. "Tādējādi Carabela arī palīdz izvairīties no zemūdens mantojuma laupīšanas," skaidro Džoana Andreu Sančesa.

Bet, neapšaubāmi, viens no pārsteidzošākajiem atradumiem šajos fondos radās, kad, meklējot ar Austrāliju saistītus terminus, piemēram, “Tierra Austral Incognita”, 18. gadsimta sākuma vēstule, kas adresēta karalim Felipem V.

“Šajā vēstulē, kuru uzrakstījis jezuīts Andrés Serrano, mēs esam atklājuši ļoti precīzas atsauces uz dienvidu kontinentu, kas datēts ar 1705. gadu, ilgi pirms kapteinis Džeimss Kuks sasniedza krastus 1770. gadā. Maz zināmi dati par Austrālijas vēsturi un kurus mēs tagad atklājam, izmantojot indeksēšanas un varbūtības meklēšanas paņēmienus, kas izstrādāti mūsu centrā, ”skaidro Enrike Vidals.

LASI, Zelta laikmets un Transkribus

Šajā pašā darbības jomā PRHLT komanda ir piedalījusies Eiropas READ projektā, kas ir pētījis un analizējis dokumenti no spāņu literatūras zelta laikmeta, starp viņiem Lope de Vega rokraksti no Nacionālās bibliotēkas krājuma un Marburgas Valsts arhīva brāļu Grimmu sarakste.

Arī no Somijas Nacionālā arhīva, no kura gandrīz 150 000 lappušu ir indeksētas, un turpmākajos projektos tas plāno indeksēt aptuveni 1 miljonu lappušu.

Tālāk, Projekta ietvaros ir izstrādāts Transkribus, programmatūras platforma, kas ļauj anotēt veco dokumentu attēlus ar lielu historiogrāfisku vērtību.

Transkribus galvenokārt tiek izmantots kā apmācības datu ģenerēšanas rīkstā kā ar roku rakstītām teksta atpazīšanas metodēm ir nepieciešami dati, lai tās automātiski iemācītos. Tuvākajā nākotnē tajā tiks iekļautas citas funkcijas, piemēram, automātiska modeļa apmācība citām valodām.

READ ir noslēdzis arī Eiropas kooperatīva izveidošanu, kuras dibinātājs ir UPV un kurš padara programmatūru Transkribus pieejamu visiem reģistrētajiem lietotājiem.

Pašlaik Transkribus platforma Tam ir vairāk nekā 30 000 lietotāju no visas pasaules, kas padara to par starptautisku uzziņu instrumentu visiem vēsturniekiem.



Komentāri:

  1. Treadway

    Ātra atbilde)))

  2. Kynthelig

    Es iesaku jums apmeklēt vietni, kurā ir daudz informācijas par jums interesējošu tēmu.

  3. Werner

    Bravo, šai izcilajai frāzei jābūt tieši mērķim

  4. Jeffrey

    Many thanks for the help in this question.



Uzrakstiet ziņojumu