Meeting, AKU Oahpa, 22.8.2014 Present: Heli, Jaska, Trond !!!Agenda * Status * Participants * Aika !!!Status !!Venäjän sanat * Most common 1500 N + 500 V + 500 A in Russian (__Trond__) !!Dokumentaatio * Correct [http://oahpa.no/addlang/index.rus.html] - not done * Burjaatin oahpa tehty (testing.oahpa.no/bxr_oahpa) -- Burjaatin sivu TODO: (__Trond__) !!Osallistujat * Kutsut lähetetty * Käyttäjänimet saatu, __Trond__ tekee tilit * Monille: ''Windows + EditPadLite + TortoiseSVN'' ** Kaikki: Katso näitä. ** __Trond__: Tsekkaa [dokumentaatio|https://giellalt.uit.no/tools/ForWindowsUsers.html] !!!Kurssin nettisivu * Mihin, ja kuka tekee? ... Silloin kun * Aikamäärä: Keskiviikko 27.8. * Nettipaikka: Sekä gt että AKU !!Topics # Methodologies for distributed cooperation on language technology # What is Oahpa - the pedagogical philosophy # What lingustic content to include - and how to add it # Practical work # Project planning # ?How to join Oahpa development with language research !!!Course planning day by day !!Preparing before the course * Setting up user accounts, basic SVN. !!Day 0: * Preliminary course in Unix, svn, etc, for people not having done this before. * All participants shall have checked out (at least) the ped catalogue and a working version of their own fst on their own machine (cf. the [getting started|https://giellalt.uit.no/infra/GettingStarted.html] page.) * basic SVN course. What is it, how to update, check in, etc. !!Monday: ! Introduction * Giellatekno overview (infrastructure, projects, tools, Oahpa) (__Heli, Trond__) * Presentations by the participants about their languages and existing resources (textbooks a.o. teaching materials, corpora, language technology tools) * Methodologies for distributed cooperation on language technology ** If needed: Practical instruction divided into groups *** Group 1: For the local guru (Heli) *** Group 2: For the computer illiterate (Jack) *** Installing, general help (Trond) ! Eventually Start with Leksa !!Tuesday: ! Leksa * The key role of Leksa in Oahpa (these are the words we use for different purposes) ** How to choose the vocabulary for Leksa. Textbook word lists, frequency dictionaries. * Creating word lists in csv format. ** [Semantic set template|https://gtsvn.uit.no/langtech/trunk/ped/rus/meta/semantical_sets.xml] ** [Lexicon template for nouns|https://gtsvn.uit.no/langtech/trunk/ped/rus/src/N_rusnob.xml] ** [Lexicon template for verbs|https://gtsvn.uit.no/langtech/trunk/ped/rus/src/v_rusnob.xml] * Checking in new files and updating the existing ones. * svn ci -> Heli updates the db -> online check. ! Morfa-S * Drafting the case/number and person/number/tense forms to be included (Individuals should have this all thought out before hand ... ) * Evaluating the fsts * Setting up the infrastructure for the respective exercises * __Homework by Thursday__: ** think about the productive Morfa-C frames in your language - which cases, which verbs? !!Wednesday: hands-on ! Numra * Evaluating existing Numras * How to improve them: ** Learning how to correct automata ** Learning how to extend Numra to ordinal, date, clock. ! Leksa, Morfa-S * Continuing work !!Thursday: hands-on * Setting up Morfa-S. Case list, possible additional menus. * Writing Morfa-C frames. * Extending Leksa: Place names. The names that are different in the indigenous language !!Friday: * General discussion ** New ideas, thoughts that have come up while implementing Oahpa for your language. ** Discussing how to integrate Oahpa in language courses. Presenting kursa * Workshop: We write grant applications ** Background: Different groups plan to get funding ** We either do brainstorming or (if possible) work in groups on concrete proposals * Summing up and future work ** How to proceed with the development of your Oahpa. {{{ Понедельник: Введение Обзор Giellatekno (инфраструктура, проекты, программные средства, Oahpa) (Хели, Трунд) Доклады участников курса об их языков и имеющихся ресурсов (учебники и другие учебные материалы, корпусы, языковые инструменты) Методологии распределенного сотрудничества в области технологии обработки естественных языков При необходимости: Практическая инструкция в группах Группа 1: Для "местного гуру" (Хели) Группа 2: Для неопытных пользователей компьютера (Джэк) Установка программ, общая помощь (Трунд) Если успеем до начнем практическую работу над программе Leksa. Вторник: Leksa Ключевая роль Leksa в Oahpa (это слова, которые мы используем для различных целей) Как выбрать словарь для Leksa. Списки слов в Учебниках, частотные словари. Создание списков слов в формате CSV. Создание списка семантических множеств по примеру. Создание лексикона имен существительных. Создание лексикона глаголов. Добавление новых файлов к SVN-дереву и обновление существующих файлов. Обычный поток работ: SVN commit -> Хели обновляет базу данных -> тестирование программы Leksa онлайн. Morfa-S Составление грамматической информации форм (падеж, число, лицо, время, вид и.т.д.) которые будут включены (Участники должны продумать эти до курса ...) Определение качества морфологического преобразователя. Настройка инфраструктуры для упражнений Morfa-S. Домашнее задание по четверг: Думать о производительных рамок для упражнений Morfa-C на Вашем языке - какие падежи, какие глаголы? Среда: практическая работа Numra Определение качества существующих модулей Numra Как улучшить их: Обучение, как исправить автоматы Обучение, как расширять Numra: порядковые числа, даты, время. Leksa, Morfa-S - продолжение работы Четверг: практическая работа Настройка Morfa-S. Список Case (падеж), возможные дополнительные меню. Создание рамок для Morfa-C. Расширение Leksa: Названия мест. Названия мест, которые отличаются в коренном языке. Пятница: Общая дискуссия Новые идеи, мысли, которые возникли в ходе реализации Oahpa для вашего языка. Обсуждение, как интегрировать Oahpa в языковых курсах. Представление сайта Kursa. Семинар: Мы пишем заявки на получение грантов Справочная информация: Различные группы планируют получить финансирование Мозговой штурм или (если это возможно) работать в группах над конкретными предложениями. Подведение итогов и будущая работа Как развивать и расширять вашего Oahpa. }}} !!Programmet * Kommentarar frå Lene * Korrekturlese russisk (Heli, Jaska) * Sette opp program på gt (Trond) og Aku (Jaska) !!!Neste møte 29.8.2014 9:30 Finsk tid