ქართული ნაწერის ამოცნობა

 
 
 ტექსტის ოპტიკური ამოცნობა (ინგლ. Optical Character Recognition, შემოკლ. OCR, იკითხება „ოუ-სი-არი“) გულისხმობს სკანერის ან ფოტოაპარატის მეშვეობით სურათზე აღბეჭდილი ასო-ნიშნების ამოცნობასა და გადაყვანას ელექტრონულ ფორმატში, რის შედეგადაც მარტივად იქნება შესაძლებელი მისი ჩასწორება და დამუშავება შესაბამისი ტექ­სტუ­რი რე­დაქ­ტო­რე­ბით, რო­გო­რებიცაა TextEdit, Notepad, Microsoft Office Word და ა.შ.
 
 ქართულისთვის ამგვარ სისტემებზე მუშაობა და მათი გამოშვება დაიწყო 90-იან წლებში, თუმცა უმეტესად დაწესებულებებისთვის იყო ხელმისაწვდომი წერილობითი მასალების გასაციფრულებლად. 
 1998 წელს გამოჩნდა პირველად რიგითი მომხმარებლებისთვის სახელწოდებით „ქორის თვალი“, მაგრამ კარგი შედეგის მისაღებად საჭიროებდა მოსამზადებელ სამუშაოებს, მათ შორის გამოსახულების აღბეჭდისთვის სათანადო პირობების შექმნას, უკვე აღბეჭდილის კარგად დამუშავებას, ზოგ შემთხვევაში კი ამოსაცნობი შრიფტის მოძიებასა და სწავლებას რამდენჯერმე შეტანის გზით, აგრეთვე, ტექსტის სხვადასხვა ნაწილისთვის საგანგებოდ მორგებას და ა. შ.
 2006 წლიდან მოხალისეების მიერ იქმნებოდა იმ დროს ცნობილი პროგრამის, ABBYY FineReader-ის არაოფიციალური დანამატი, რომელსაც წინასწარ სათითაოდ ნასწავლი ასონიშნებისა და მოხაზულობის საფუძველზე შეეძლო ნაწერის ამოცნობა, მაგრამ სიზუსტე მაინც არ იყო სათანადო, ამასთანავე, პრობლემა იყო ოდნავ განსხვავებული შრიფტით შესრულებული ტექსტის მიწოდების შემთხვევაშიც კი, ხოლო პროგრამის ახალი ვერსიებიდან მოყოლებული ამგვარი დანამატების მხარდაჭერა მწარმოებელმა საერთოდ შეწყვიტა.
 
 2010 წლიდან გაეშვა ვებმომსახურება targmne.ge, რომელსაც გააჩნდა ქართულისთვის მორგებული ტექსტის ოპტიკური ამოცნობის  შესაძლებლობა მცირე რესურსებისთვის. ბოლოს განახლდა 2021 წელს.
 2012 წელს კი ღია წყაროს მქონე წამკითხველი ძრავის რამდენიმეწლიანი გადამუშავების შედეგად გამოჩნდა კიდევ ერთი ქართული პროგრამა SunnyPage და წინა საშუალებებთან შედარებით გაცილებით ადვილად გამოსაყენებელი და ზუსტი იყო. ბოლო საცდელი ვერსიის გადმოწერა ოფიციალური საიტიდანაა შესაძლებელი:
 აგრეთვე, დროდადრო ჩნდებოდა სხვადასხვა კომპანიებისა თუ ფიზიკურ პირთა ნამუშევრები, რომლებიც განკუთვნილი  იყო ორგანიზაციათა მომსახურებისთვის. გარდა ამისა, სახელმწიფო უნივერსიტეტში, ტექნიკურ უნივერსიტეტში, ილიას უნივერსიტეტსა და სხვა სასწავლო-სამეცნიერო დაწესებულებებში ენის ციფრული საშუალებების კვლევებისა და დამუშავებისას შეიქმნა არაერთი საჩვენებელი პროგრამა თუ ვებმომსახურება ქართული ტექსტის ამოსაცნობად, მაგრამ ფართოდ არ გამოიყენებოდა.
 
 დღესდღეობით, ყველაზე მეტად გავრცელებულ და თა­ვი­სუფ­ლად ხელ­მი­საწ­ვდომ სის­ტე­მას წარ­მო­ად­გენს „ტე­სე­რაქ­ტი“ (ინგლ. Tesseract), რომლის შემქმნელიცაა აპარატურის ცნობილი მწარმოებელი hp (Hewlett-Packard). აღნიშნული ძრავას კოდის წყარო კომპანიამ 2005 წელს გაასაჯაროვა, ხოლო 2006 წლი­დან 2018 წლამდე მის განვითარებასა და დაფინანსებას უზ­რუნ­ველ­ყოდა Google.
 დღეს იგი ერთ-ერ­თი ყვე­ლა­ზე გა­მარ­თუ­ლი ღია სის­ტე­მაა, რო­მელ­საც საკ­მა­ოდ მა­ღა­ლი სი­ზუს­ტით შე­უძ­ლია ამო­იც­ნოს მრა­ვა­ლი სხვა­დას­ხვა დამ­წერ­ლო­ბით შედ­გე­ნი­ლი ტექ­სტი.
 
 2015 წლის ივლისში გამოსულ  3.04 ვერ­სი­აში კი ოფიციალურად დაემატა ქართულის მხარდაჭერაც, მათ შორის ძველქართული დამწერლობისაც (ხუცური).
 მი­სი ძრავას გადმოწერა საკუთარ პროგრამაში ინტეგრაციისთვის ან ბრძანებების ველის მეშვეობით გამოყენება შესაძლებელია GitHub-გვერდიდან:
 მის უკეთ გაწვრთნილ და გაუმჯობესებულ ვერსიას Google თავის მომხმარებელს სთავაზობს საკუთარი ღრუბლოვანი მომსახურებითაც, სახელწოდებით Google Vision, რომლის შეძენაც შესაძლებელია cloud.Google.com გვერდიდან:
 გარდა ამისა, უფასოდაა ხელმისაწვდომი გუგლის სხვადასხვა მომსახურებებსა და პროდუქტებში (Google Search, Google docs, Google Lens). მეტად მოსახერხებელად გამოსაყენებელია მობილურ აპლიკაციით Google Lens, რომელსაც პირდაპირ ტელეფონის კამერის მეშვეობით შეუძლია სურათიდან ტექსტის ამოღება.
 
 
 Google Docs-ის მაგალითზე გამოყენებისთვის იხი­ლეთ ვი­დეო, ხოლო გარკვეული შეზღუდვების შესახებ დაწ­ვრი­ლე­ბით იხი­ლეთ დახ­მა­რე­ბის გვერ­დზე.
 
 2018 წლიდან კი უკვე ქართული ხელნაწერის ამოცნობაც ხერხდება (Google Handwriting Recognition). მისი გამოიყენება შესაძლებელია სხვადასხვა მომსახურებაში ტექსტის შეყვანისას (Google Search, Youtube, Gmail). მოსინჯვა შეიძლება ვებგვერდიდან Google Input Tools, ხოლო მობილურზე ემატება კლავიატურის სახითაც Gboard-აპლიკაციის მეშვეობით.
 აღსანიშნავია, რომ ცნობს მეტად გაკრული ხელითა და თავისებური სტილით მოხაზულ ასონიშნებსაც, მიუხედავად გადაბმის სირთულისა.

გასათვალისწინებელია, რომ გუგლის მომსახურებებით უფასო სარგებლობისას შეყვანილი ნებისმიერი ტექსტი იგზავნება სერვერებზე და შეიძლება აღირიცხებოდეს პროდუქტის გასაუმჯობესებლად.

 ამას გარდა, არსებობს არა­ერ­თი სხვა ღია პრო­ექ­ტი­, რომ­ლე­ბიც და­ფუძ­ნე­ბუ­ლია ტე­სე­რაქ­ტის ძრა­ვა­ზე და Google-ის სერ­ვი­სე­ბის გამოუყენებლად იძ­ლე­ვა ადვილად სარ­გებ­ლო­ბის სა­შუა­ლე­ბას სხვა­დას­ხვა სის­ტე­მა­ზე და ვებ­სივ­რცე­შიც კი.
 
 პროგ­რა­მა დასახელებით gImageReader ხელ­მი­საწ­ვდო­მია Github-ზე და თავ­სე­ბა­დია რო­გორც Windows სის­ტე­მას­თან, ასე­ვე Linux-ის დის­ტრი­ბუ­ტი­ვებ­თან. შე­საძ­ლე­ბე­ლია მი­სი და­ყე­ნე­ბა ან პირ­და­პირ გაშ­ვე­ბა. ერ­თბა­შად მრა­ვა­ლი ტექ­სტის და­მუ­შა­ვე­ბი­სა და სხვა­დას­ხვა ფორ­მა­ტით შე­ტა­ნის ან შე­ნახ­ვის უნა­რი აქვს. აღ­ჭურ­ვი­ლია და­მა­ტე­ბი­თი ფუნ­ქცი­ებით, რო­გო­რი­ცაა გა­მო­სა­ხუ­ლე­ბის და­მუ­შა­ვე­ბა, სიმ­კვეთ­რის მო­მა­ტე­ბა, სი­კაშ­კა­შის მორ­გე­ბა, ტექ­სტის ხე­ლით შე­მო­საზ­ღვრა და ამოც­ნო­ბის შემ­დეგ მარ­თლწე­რის გას­წო­რე­ბაც.

 
 გარდა ამისა, მოიძებნება არაერთი ვებსაიტიც, რო­მელ­თა მეშ­ვეო­ბი­თაც სწრა­ფად და მარ­ტი­ვა­დაა შე­საძ­ლე­ბე­ლი მცირე ზომის ატ­ვირ­თუ­ლი სუ­რა­თიდან ტექ­სტის ამოღება რე­გის­ტრა­ცი­ის ან და­მა­ტე­ბი­თი პროგ­რა­მე­ბის ჩა­მოტ­ვირ­თვი­სა და გაშ­ვე­ბის გა­რე­შეც:

Comments