ტექსტის ოპტიკური ამოცნობა (ინგლ. Optical Character Recognition, შემოკლ. OCR, იკითხება „ოუ-სი-არი“) გულისხმობს სკანერის ან ფოტოაპარატის მეშვეობით სურათზე აღბეჭდილი ასო-ნიშნების ამოცნობასა და გადაყვანას ელექტრონულ ფორმატში, რის შედეგადაც მარტივად იქნება შესაძლებელი მისი ჩასწორება და დამუშავება შესაბამისი ტექსტური რედაქტორებით, როგორებიცაა TextEdit, Notepad, Microsoft Office Word და ა.შ.
ქართულისთვის ამგვარ სისტემებზე მუშაობა და მათი გამოშვება დაიწყო 90-იან წლებში, თუმცა უმეტესად დაწესებულებებისთვის იყო ხელმისაწვდომი წერილობითი მასალების გასაციფრულებლად.
1998 წელს გამოჩნდა პირველად რიგითი მომხმარებლებისთვის სახელწოდებით „ქორის თვალი“, მაგრამ კარგი შედეგის მისაღებად საჭიროებდა მოსამზადებელ სამუშაოებს, მათ შორის გამოსახულების აღბეჭდისთვის სათანადო პირობების შექმნას, უკვე აღბეჭდილის კარგად დამუშავებას, ზოგ შემთხვევაში კი ამოსაცნობი შრიფტის მოძიებასა და სწავლებას რამდენჯერმე შეტანის გზით, აგრეთვე, ტექსტის სხვადასხვა ნაწილისთვის საგანგებოდ მორგებას და ა. შ.
2006 წლიდან მოხალისეების მიერ იქმნებოდა იმ დროს ცნობილი პროგრამის, ABBYY FineReader-ის არაოფიციალური დანამატი, რომელსაც წინასწარ სათითაოდ ნასწავლი ასონიშნებისა და მოხაზულობის საფუძველზე შეეძლო ნაწერის ამოცნობა, მაგრამ სიზუსტე მაინც არ იყო სათანადო, ამასთანავე, პრობლემა იყო ოდნავ განსხვავებული შრიფტით შესრულებული ტექსტის მიწოდების შემთხვევაშიც კი, ხოლო პროგრამის ახალი ვერსიებიდან მოყოლებული ამგვარი დანამატების მხარდაჭერა მწარმოებელმა საერთოდ შეწყვიტა.
2010 წლიდან გაეშვა ვებმომსახურება targmne.ge, რომელსაც გააჩნდა ქართულისთვის მორგებული ტექსტის ოპტიკური ამოცნობის შესაძლებლობა მცირე რესურსებისთვის. ბოლოს განახლდა 2021 წელს.
2012 წელს კი ღია წყაროს მქონე წამკითხველი ძრავის რამდენიმეწლიანი გადამუშავების შედეგად გამოჩნდა კიდევ ერთი ქართული პროგრამა SunnyPage და წინა საშუალებებთან შედარებით გაცილებით ადვილად გამოსაყენებელი და ზუსტი იყო. ბოლო საცდელი ვერსიის გადმოწერა ოფიციალური საიტიდანაა შესაძლებელი:
აგრეთვე, დროდადრო ჩნდებოდა სხვადასხვა კომპანიებისა თუ ფიზიკურ პირთა ნამუშევრები, რომლებიც განკუთვნილი იყო ორგანიზაციათა მომსახურებისთვის. გარდა ამისა, სახელმწიფო უნივერსიტეტში, ტექნიკურ უნივერსიტეტში, ილიას უნივერსიტეტსა და სხვა სასწავლო-სამეცნიერო დაწესებულებებში ენის ციფრული საშუალებების კვლევებისა და დამუშავებისას შეიქმნა არაერთი საჩვენებელი პროგრამა თუ ვებმომსახურება ქართული ტექსტის ამოსაცნობად, მაგრამ ფართოდ არ გამოიყენებოდა.
დღესდღეობით, ყველაზე მეტად გავრცელებულ და თავისუფლად ხელმისაწვდომ სისტემას წარმოადგენს „ტესერაქტი“ (ინგლ. Tesseract), რომლის შემქმნელიცაა აპარატურის ცნობილი მწარმოებელი hp (Hewlett-Packard). აღნიშნული ძრავას კოდის წყარო კომპანიამ 2005 წელს გაასაჯაროვა, ხოლო 2006 წლიდან 2018 წლამდე მის განვითარებასა და დაფინანსებას უზრუნველყოდა Google.
დღეს იგი ერთ-ერთი ყველაზე გამართული ღია სისტემაა, რომელსაც საკმაოდ მაღალი სიზუსტით შეუძლია ამოიცნოს მრავალი სხვადასხვა დამწერლობით შედგენილი ტექსტი.
2015 წლის ივლისში გამოსულ 3.04 ვერსიაში კი ოფიციალურად დაემატა ქართულის მხარდაჭერაც, მათ შორის ძველქართული დამწერლობისაც (ხუცური).
მისი ძრავას გადმოწერა საკუთარ პროგრამაში ინტეგრაციისთვის ან ბრძანებების ველის მეშვეობით გამოყენება შესაძლებელია GitHub-გვერდიდან:
მის უკეთ გაწვრთნილ და გაუმჯობესებულ ვერსიას Google თავის მომხმარებელს სთავაზობს საკუთარი ღრუბლოვანი მომსახურებითაც, სახელწოდებით Google Vision, რომლის შეძენაც შესაძლებელია cloud.Google.com გვერდიდან:
გარდა ამისა, უფასოდაა ხელმისაწვდომი გუგლის სხვადასხვა მომსახურებებსა და პროდუქტებში (Google Search, Google docs, Google Lens). მეტად მოსახერხებელად გამოსაყენებელია მობილურ აპლიკაციით Google Lens, რომელსაც პირდაპირ ტელეფონის კამერის მეშვეობით შეუძლია სურათიდან ტექსტის ამოღება.
Google Docs-ის მაგალითზე გამოყენებისთვის იხილეთ ვიდეო, ხოლო გარკვეული შეზღუდვების შესახებ დაწვრილებით იხილეთ დახმარების გვერდზე.
2018 წლიდან კი უკვე ქართული ხელნაწერის ამოცნობაც ხერხდება (Google Handwriting Recognition). მისი გამოიყენება შესაძლებელია სხვადასხვა მომსახურებაში ტექსტის შეყვანისას (Google Search, Youtube, Gmail). მოსინჯვა შეიძლება ვებგვერდიდან Google Input Tools, ხოლო მობილურზე ემატება კლავიატურის სახითაც Gboard-აპლიკაციის მეშვეობით.
აღსანიშნავია, რომ ცნობს მეტად გაკრული ხელითა და თავისებური სტილით მოხაზულ ასონიშნებსაც, მიუხედავად გადაბმის სირთულისა.
გასათვალისწინებელია, რომ გუგლის მომსახურებებით უფასო სარგებლობისას შეყვანილი ნებისმიერი ტექსტი იგზავნება სერვერებზე და შეიძლება აღირიცხებოდეს პროდუქტის გასაუმჯობესებლად.
ამას გარდა, არსებობს არაერთი სხვა ღია პროექტი, რომლებიც დაფუძნებულია ტესერაქტის ძრავაზე და Google-ის სერვისების გამოუყენებლად იძლევა ადვილად სარგებლობის საშუალებას სხვადასხვა სისტემაზე და ვებსივრცეშიც კი.
პროგრამა დასახელებით gImageReader ხელმისაწვდომია Github-ზე და თავსებადია როგორც Windows სისტემასთან, ასევე Linux-ის დისტრიბუტივებთან. შესაძლებელია მისი დაყენება ან პირდაპირ გაშვება. ერთბაშად მრავალი ტექსტის დამუშავებისა და სხვადასხვა ფორმატით შეტანის ან შენახვის უნარი აქვს. აღჭურვილია დამატებითი ფუნქციებით, როგორიცაა გამოსახულების დამუშავება, სიმკვეთრის მომატება, სიკაშკაშის მორგება, ტექსტის ხელით შემოსაზღვრა და ამოცნობის შემდეგ მართლწერის გასწორებაც.
გარდა ამისა, მოიძებნება არაერთი ვებსაიტიც, რომელთა მეშვეობითაც სწრაფად და მარტივადაა შესაძლებელი მცირე ზომის ატვირთული სურათიდან ტექსტის ამოღება რეგისტრაციის ან დამატებითი პროგრამების ჩამოტვირთვისა და გაშვების გარეშეც:
Comments