Changes between Version 1 and Version 2 of WikiStartCZ


Ignore:
Timestamp:
Jan 6, 2016, 1:59:25 PM (8 years ago)
Author:
xkocinc
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • WikiStartCZ

    v1 v2  
    99== O projektu ==
    1010
    11 The main objectives of the HaBiT project are to gather large-scale text data (corpora) from the Web for under-resourced languages, involving Norwegian, partly Czech and the major languages of Ethiopia — Amharic, Afaan Oromo, Tigrinya, Somali — and to build shallow processing applications. The gathered data will be processed to make it usable in many language applications, such as information extraction or machine translation. Furthermore, in the process of collecting corpora data, existing tools for building web text resources will be further developed and improved since the Ethiopian languages are quite different from most European languages. Applications for the given languages will be built to allow for the separation and disambiguation of multiple senses of words.
     11Hlavním cílem projektu Habit je jednak shromáždit velká textová data (korpusy) z Webu pro jazyky s nedostatečnými zdroji včetně norštiny a částečně češtiny a také hlavní etiopské jazyky - amharštinu, afaan oromštinu, tingrinštinu, somálštinu a jednak vytvořit aplikace pro jejich mělké zpracování. Získaná data budou zpracována tak, aby mohla být použita v řadě jazykových aplikací, jako je extrakce informací a strojový překlad. V průběhu budování korpusových dat budou dále vyvíjeny a zlepšovány existující nástroje pro získávání webových textových zdrojů, protože etiopské jazyky se výrazně liší od od většiny evropských jazyků. Aplikace pro zmíněné jazyky budou budovány tak, aby dovolily zkoumat a vyčleňovat víceznačnost slovních významů.
    1212
    1313
    1414== Cíle projektu ==
    1515
    16  1. Creating a repository for the investigated languages and making them freely accessible for further research (especially in Ethiopia and Norway).
    17  1. Presenting results obtained in the Project to the research community and disseminate the result via the HaBiT project web pages.
    18  1. In general, the accessibility of the results will push forward the research in the area of the under-resourced language and in this way contribute to promoting our knowledge of these languages in a longer perspective.
    19  1. The project results will make it possible to acquire information technologies in a less-developed country and contribute to its cultural development.
     16 1. Vytvoření repozitáře pro zkoumané jazyky a zveřejnění jej veřejnosti pro další výzkum (zejména v Etiopii a Norsku).
     17 1. Prezentování výsledků vytvořených v Projektu výzkumné komunitě a šířit je pomocí webové stránky Projektu HaBiT.
     18 1. Dostupnost výsledků pomůže posunout výzkum v oblasti s nedostatečným množstvím zdrojů a dále přispěje k šíření znalostí o daných jazycích v dlouhodobém měřítku.
     19 1. Výsledky projektu budou nápomocny při získávání informačních technologií v méně rozvinutých zemí a přispějí k jejich kulturnímu rozvoji.
    2020
    2121