Arbeidet er delt i 4 fasar, omtrent slik; 1) definera passande tekstkategoriar, dvs teksttypar som vi trur oppfyller desse kriteria: * det vil vera relativt mange skrivefeil (dvs utan stavekontroll, uformell stil, osb) * tekstane er fritt tilgjengelege på Internett * den same teksttypen er tilgjengeleg for nordsamisk 2) samla inn ein tilstrekkeleg mengde med slike tekstar på norsk (ein eller fleire i gruppa vår vil gjera det same for nordsamisk) 3)