Gregoriánský chorál se chová jako biologický protein, říká český vědec
Jan Hajič mladší unikátně kombinuje znalosti a metody počítačové lingvistiky i bioinformatiky pro digitální práci s hudbou a jejím zápisem
Digitalizace notových záznamů se na první pohled může zdát jako banalita – stačí skenovat a digitálně rozpoznat noty. Ve skutečnosti „je to věda“ – a Češi v ní hrají první housle. „Běžný text se dá prohnat ‚ócéerkem‘ (Optical Character Recognition), to už velmi dobře umíme a díky tomu můžeme textově prohledávat digitální archivy dokumentů. U not ale nelze stejné metody přímočaře použít, protože se jednotlivé notační znaky – hlavičky, trámce či klíče – nečtou jenom zleva doprava jako po sobě jdoucí písmena. Noty jsou v tomto smyslu chaos, a OMR (Optical Music Recognition) se tím pádem musí řešit jinak,“ vysvětluje vědec-hudebník Jan Hajič mladší.
Spolu se zahraničními kolegy vymyslel originální postup „čtení“ not . „V prvním kroku bývalo potřeba notový zápis digitálně ‚vyčistit‘ od inkoustových kaněk, stop od kávy a dalších kazů,“ líčí. „Poté se rozpoznávaly notové osnovy a následně další notační symboly. My jsme začali pracovat s konvolučními neuronovými sítěmi, díky kterým šlo tyto kroky zkombinovat do jednoho, přesnějšího.“ To však ještě nebylo nikterak převratné, neboť s neuronovými sítěmi začínal v té době pracovat každý, kdo se strojovým viděním zabýval. Zásadní a specifický pro práci s hudební notací je však další krok: rozšifrovat hudební význam rozpoznaných znaků. „Ke každé zapsané notě potřebujeme znát její výšku, délku a okamžik, kdy má být zahrána. Na to je třeba jednotlivé znaky správně zkombinovat, například určit, kde v notové osnově rozpoznaná notová hlavička leží a které křížky či béčka se jí týkají,“ popisuje vědec-hudebník.
Zde se ukázalo jako obrovská výhoda, že Jan Hajič pracoval v Ústavu formální a aplikované lingvistiky na Matematicko-fyzikální fakultě Univerzity Karlovy. „Klíčovým průlomem bylo použít, na rozdíl od dosavadních přístupů, závislostní modely – lingvistické metody dlouho vyvíjené pro češtinu s jejím volným slovosledem. Notová hlavička z této perspektivy funguje trochu jako přísudek věty a další znaky, které kódují výšku a délku noty, jsou něco jako ostatní větné členy. Díky tomuto modelu jde pak kombinování znaků také řešit pomocí strojového učení, které je obzvlášť pro rukopisnou notaci výrazně vhodnější než vymýšlet dlouhé seznamy pravidel.“
Celý článek je dostupný předplatitelům týdeníku Hrot