2022 میں دستیاب 7 اردو OCR سافٹ ویئر کا تجزیہ

اردو زبان کے لیے بہترین کریکٹر ریکگنیشن ٹیکنالوجی کسی بھی دوسری زبان کی طرح اس کے بولنے والوں کی تاریخ اور ثقافت کے تحفظ اور فروغ میں بہت اہمیت رکھتی ہے۔

اردو برصغیر پاک و ہند میں 1854 سے بڑے پیمانے پر استعمال ہوتی رہی ہے اور اس جغرافیائی خطے کی تاریخ اور ثقافت اردو زبان میں گہرائی سے پیوست ہے۔ اردو OCR جدید ترین لینگویج پروسیسنگ ٹیکنالوجیز میں سے ایک ہے جسے اردو ادب کے ساتھ ساتھ تاریخی اہمیت کی حامل دیگر تحریروں تک رسائی، تلاش اور تقسیم کے لیے استعمال کیا جا سکتا ہے۔ OCR تکنیک تصویروں کے درمیان متن کو پہچاننے کے لیے کمپیوٹر وژن کا استعمال کرتی ہے اور پھر مشین کے ذریعے پڑھنے کے قابل یونیکوڈ فارمیٹ میں بدل جاتی ہے۔ اس لیے اس ٹیکنالوجی کو استعمال کرتے ہوئے پورے اردو ادب کو (عوامی ڈومین میں) یونیکوڈ ٹیکسٹ میں تبدیل کرکے آن لائن ڈیٹا بیس یا اوپن لائبریری میں اپ لوڈ کیا جاسکتا ہے۔ اس سے کسی محقق یا کسی ادبی شاعر کے لیے کسی دیے گئے جملے یا حوالے کا ماخذ تلاش کرنا ممکن ہو جائے گا۔

یہ پڑھ کر آپ سوچ رہے ہوں گے کہ اگر یہ سب ممکن ہے تو پہلے ایسا کیوں نہیں ہوا؟ تو، یہاں کیچ ہے: اردو زبان اس کے ملحقہ خطوط کے نظام اور نستعلیق کے نام سے مشہور کرسیو تحریری رسم الخط کے پیش نظر کردار کی شناخت کے لیے ایک بہت مشکل زبان ہے۔ یہ خصوصیات اردو مواد کی متن کی شناخت کی درستگی کو کم کرتی ہیں۔ بہر حال، اس سے آپ کو مایوس نہیں ہونا چاہیے کیونکہ اب بھی کچھ اردو OCR سافٹ ویئر موجود ہیں جو پیچیدگیوں کے باوجود اچھی درستگی کے ساتھ اردو متن کی شناخت کرنے کی صلاحیت رکھتے ہیں۔ مزید برآں، مصنوعی ذہانت اور مشین لرننگ کے شعبوں میں ہونے والی پیش رفت کے ساتھ، یہ درستگی بہتر ہونے کی پابند ہے۔

فھرست

جائزہ
گوگل کلاؤڈ ویژن
گوگل دستاویزات / گوگل کیپ / گوگل لینس
اخیر 2016
CLE Nastalique OCR
ٹیسریکٹ
ایبی فائن ریڈر
Texify بوٹ

لہذا، یہاں، ہم 2022 میں دستیاب تمام 7 اردو OCR سافٹ ویئر کا جائزہ لیتے ہیں، فہرست کے اوپری حصے میں سب سے درست کے ساتھ۔

1. گوگل کلاؤڈ ویژن

کلاؤڈ ویژن اپنی اعلیٰ درستگی کی بدولت اردو زبان کے لیے OCR ٹیکنالوجی میں غیر مسابقتی طور پر سرفہرست مقام رکھتا ہے۔ یہ ہاتھ سے لکھے ہوئے اردو متن کو اچھی طرح پہچاننے اور نکالنے کے قابل ہے، اور نستعلیق میں لکھے ہوئے متن کے ساتھ، اس کی درستگی بے عیب ہے۔ کلاؤڈ ویژن گوگل کے کلاؤڈ کمپیوٹنگ پلیٹ فارم GCP کا ایک حصہ ہے، اور اس کی کامیابی گوگل کے اعلیٰ درجے کے AI ماڈلز اور ایک بڑے ڈیٹا سیٹ تک رسائی میں مضمر ہے۔

Cloud Vision ڈاؤن لوڈ کے قابل سافٹ ویئر کے طور پر دستیاب نہیں ہے۔ اس کے بجائے، ویب پر مبنی Google Cloud Console سے اس تک رسائی حاصل کی جا سکتی ہے یا API کے ذریعے کال کی جا سکتی ہے۔ اس لیے، اس کا استعمال نان ٹیک سیوی صارفین کے لیے تھوڑا مشکل ہو سکتا ہے، اور ٹیک سیوی صارفین کے لیے بھی قدرے تکلیف دہ ہو سکتا ہے۔ اس مسئلے کو حل کرنے کے لیے، کچھ پاکستانی ڈویلپرز نے کلاؤڈ ویژن کے لیے فرنٹ اینڈ ٹولز بنائے ہیں جنہیں آپ کے گوگل اکاؤنٹ کے ساتھ باآسانی انٹیگریٹ کیا جا سکتا ہے، اور پھر آپ ان فرنٹ اینڈ ٹولز سے پورا عمل ہینڈل کر سکتے ہیں۔ ان ٹولز کی فہرست اس مضمون کے آخر میں دی گئی ہے۔

قیمت کا تعین: کلاؤڈ ویژن ہر ماہ 1000 تصاویر/صفحات کے لیے مفت متن کی شناخت پیش کرتا ہے۔ مفت درجے کے بعد، 1000 امیجز/صفحات کے ہر یونٹ کی قیمت صرف $1.50 ہے، جو کہ اس کے اولین مقام کے پیش نظر کافی معقول ہے۔

2. Google Docs/ Google Keep/ Google Lens

اگر آپ کی OCR ضروریات آسان ہیں، اور کلاؤڈ ویژن آپ کے لیے بہت زیادہ محسوس ہوتا ہے، تو گوگل کے پاس آپ کے لیے ایک اور حل ہے۔ اگرچہ یہ بنیادی طور پر OCR سافٹ ویئر نہیں ہیں، گوگل سویٹ کے تین پروڈکٹس ٹیکسٹ ریکگنیشن کر سکتے ہیں اور اردو OCR کے طور پر استعمال کیے جا سکتے ہیں، یعنی: Google Docs، Google Keep، اور Google Lens۔ Keep اور Lens صرف تصاویر کے ساتھ کام کرتے ہیں، جب کہ Docs PDF فائلوں سے متن کو بھی پہچان سکتا ہے، حالانکہ اس کی درستگی زیادہ ہوتی ہے جب اس کی بجائے تصاویر استعمال کی جاتی ہیں۔

یہ معلوم نہیں ہے کہ کون سا OCR انجن ان مصنوعات کو طاقت دیتا ہے، غالباً یہ کلاؤڈ ویژن ہے۔ تاہم، سب سے حیران کن حقیقت یہ ہے کہ Docs، Keep، اور Lens ایک ہی اردو تصویر کے ساتھ قدرے مختلف نتائج دیں گے۔ ایک چھوٹے سے ٹیسٹ میں پتہ چلا کہ درستگی کے لحاظ سے گوگل کیپ پہلے نمبر پر ہے، پھر گوگل ڈاکس، پھر گوگل لینس۔ تاہم، یہ استعمال شدہ تصاویر کے لحاظ سے مختلف ہو سکتا ہے۔ مجموعی طور پر، جب کوئی تصویر PNG فارمیٹ میں اپ لوڈ کی جاتی ہے تو نتائج بہترین ہوتے ہیں۔ یہاں یہ ہے کہ آپ انہیں تصویر سے متن نکالنے کے لیے کیسے استعمال کر سکتے ہیں:

Google Keep: گوگل کیپ پر ایک تصویر اپ لوڈ کریں یا گوگل کیپ موبائل ایپ کے ساتھ متن پر مشتمل تصویر کیپچر کریں۔ تصویر پر مشتمل ایک نیا نوٹ بنایا جائے گا۔ اس کے اختیارات دیکھنے کے لیے نوٹ کے نیچے تین عمودی نقطوں (⋮) پر کلک کریں، اور "تصویر کا متن پکڑیں" پر کلک کریں۔ نوٹ میں یونیکوڈ فارمیٹ میں متن شامل کیا جائے گا، جسے کاپی کیا جا سکتا ہے۔

Google Docs: مطلوبہ تصویر کو Google Drive پر اپ لوڈ کریں۔ اپ لوڈ ہونے پر، تصویر پر دائیں کلک کریں اور Open with > Google Docs کو منتخب کریں۔ Google Docs ایک نئے ٹیب میں کھلے گا اور متن تصویر کے نیچے خودکار طور پر دیا جائے گا۔

Google Lens: اپنے فون پر گوگل ایپ میں، سرچ بار کے دائیں سرے پر چھوٹے کیمرہ آئیکن (📷) پر کلک کریں۔ ایک تصویر لیں یا گیلری سے ایک کو منتخب کریں۔ لینس تصویر پر کارروائی کرنے کے بعد، نیچے لے آؤٹ سے "ٹیکسٹ" کا اختیار منتخب کریں۔ تصویر پر موجود متن کو نمایاں کیا جائے گا اور پھر اسے منتخب اور کاپی کیا جا سکتا ہے۔ پی سی پر، آپ تصویر کو گوگل فوٹوز پر اپ لوڈ کر سکتے ہیں، اور وہاں آپ کو گوگل لینس کے ساتھ تصویر تلاش کرنے کا آپشن ملے گا۔

قیمت کا تعین: Google Docs، Google Keep، اور Google Lens مفت میں دستیاب ہیں۔

3. Akhar 2016

ہندوستان میں اردو بولنے والوں کی آبادی 50 ملین سے زیادہ ہے اور یہی وجہ ہے کہ ہندوستان میں اردو زبان کی ڈیجیٹلائزیشن پر بھی کام جاری ہے۔ 2016 میں، پنجابی یونیورسٹی، پٹیالہ کے ایک تحقیقی مرکز نے "اکھڑ" کے نام سے ایک ورڈ پروسیسر تیار کیا، جو گورمکھی، ہندی، شاہ مکھی (اردو رسم الخط) اور انگریزی زبان کو سپورٹ کرتا ہے۔ قابل ذکر بات یہ ہے کہ اس میں گورمکھی، انگریزی اور اردو کے لیے OCR فیچر بھی تھا۔ OCR فیچر کو بعد میں اخیر 2021 میں بند کر دیا گیا تھا۔

اخر 2016 میں کمپیوٹر پر مشتمل متن کے ساتھ بہت اچھی درستگی ہے۔ لیکن یہ ہاتھ سے لکھے ہوئے متن کے لیے زیادہ مفید نہیں ہے کیونکہ اس کی درستگی بہت کم ہے۔ مزید برآں، اردو OCR کے کام کرنے کے لیے، تصویر میں کم از کم 300 DPI ریزولوشن ہونا چاہیے، اور متن کثیر کالم نہیں ہونا چاہیے۔

قیمت کا تعین: اخر 2016 کو اس کی ویب سائٹ سے مفت ڈاؤن لوڈ کیا جا سکتا ہے۔

4. CLE Nastalique OCR

پاکستان میں اردو OCR کی ضرورت کو 2006 کے اوائل میں ہی تسلیم کیا گیا تھا۔ بہت سے کمپیوٹر سائنس دانوں نے اس پر تحقیق کی اور بہت سے مقالے لکھے گئے۔ عملی کام 2012 میں اس وقت شروع ہوا جب KICS، یونیورسٹی آف انجینئرنگ اینڈ ٹیکنالوجی، لاہور میں واقع سینٹر فار لینگوئج انجینئرنگ (CLE) نے ایک مناسب اردو OCR سافٹ ویئر تیار کرنے کے لیے ایک پروجیکٹ شروع کیا۔ یہ پروجیکٹ 2014 میں CLE Nastalique OCR کی تخلیق کے ساتھ مکمل ہوا۔

CLE Nastalique OCR شروع سے نہیں بنایا گیا ہے بلکہ اسے اوپن سورس OCR انجن Tesseract میں ترمیم کرکے تیار کیا گیا ہے۔ CLE OCR بہت سی حدود کے ساتھ آتا ہے، کیونکہ صرف نوری نستعلیق فونٹ میں تحریر کردہ متن کو پہچانا جا سکتا ہے۔ مزید برآں، تصویر کو ڈیسکیو کیا جانا چاہیے اور اس میں کم از کم 300 DPI ریزولوشن ہونا چاہیے۔ اگر تصاویر ان اعلیٰ معیارات کو برقرار رکھتی ہیں تو درستگی کافی اچھی ہے۔ بظاہر، اس سافٹ ویئر میں مزید کوئی بہتری یا اپ ڈیٹ نہیں ہوا اور اسی وجہ سے یہ OCR اتنا مفید نہیں ہے جتنا کہ ہونا چاہیے۔

قیمتوں کا تعین: CLE Nastalique OCR تک مختلف طریقوں سے رسائی حاصل کی جا سکتی ہے۔ CLE NLP ویب سروسز کا استعمال کرتے ہوئے، متن کو انفرادی تصاویر سے مفت میں پہچانا جا سکتا ہے۔ بلک امیجز کے لیے، کوئی CLE اردو OCR API استعمال کر سکتا ہے جس کی قیمت 2MB سے کم تصویر کے لیے PKR 0.5 اور 2MB سے بڑی تصویر کے لیے PKR 0.25 فی MB ہے۔ مزید یہ کہ، ایک پیکڈ سافٹ ویئر ہے جسے CLE ویب سائٹ سے 15,000 PKR یا 250 USD میں خریدا جا سکتا ہے۔

5. ٹیسریکٹ Tesseract

Tesseract ایک اوپن سورس OCR انجن ہے جو اپنی بہترین درستگی کے لیے مشہور ہے۔ ٹیسریکٹ HP نے 1980 کی دہائی میں تیار کیا تھا اور اسے 2005 میں اوپن سورس بنایا گیا تھا۔ 2006 سے، گوگل اس کی مزید ترقی کو سپانسر کر رہا ہے۔ Tesseract اردو سمیت 100 سے زیادہ زبانوں کو سپورٹ کرتا ہے اور پیچیدہ لے آؤٹ سے متن کو ذہانت سے پہچاننے کی صلاحیت رکھتا ہے۔

Tesseract میں اردو متن کی اصل شکل میں قابل عمل شناخت نہیں ہے۔ تاہم، اس کی خوبصورتی اس میں مضمر ہے کہ یہ ایک اوپن سورس OCR انجن ہے، جس کا مطلب ہے کہ متن کی بہتر شناخت کے لیے اسے دستی طور پر تربیت دی جا سکتی ہے یا اس میں ترمیم کی جا سکتی ہے۔ مناسب تربیت کے بعد Tesseract اردو متن کو پہچاننے میں کامیاب ہو گیا ہے۔ اردو OCR ٹیکنالوجی میں دلچسپی رکھنے والے ڈویلپرز کے لیے، یہ اردو OCR کی ترقی کے لیے ایک اچھی بنیاد فراہم کر سکتا ہے، کیونکہ CLE Nastalique OCR بھی Tesseract انجن کا استعمال کرتا ہے۔

Tesseract کا سورس کوڈ Github پر دستیاب ہے، اور اس کا پیکیج انسٹالر یہاں سے ڈاؤن لوڈ کیا جا سکتا ہے۔ چونکہ اس میں گرافیکل یوزر انٹرفیس (GUI) نہیں ہے، اس لیے اسے استعمال کرنا تکنیکی طور پر ڈویلپرز کے علاوہ دوسرے لوگوں کے لیے مشکل ہو سکتا ہے۔ VietOCR Tesseract کے لیے ایک مقبول فرنٹ اینڈ ہے جو اسے استعمال کرنا آسان بنا سکتا ہے۔

قیمتوں کا تعین: چونکہ ٹیسریکٹ اوپن سورس ہے، یہ مفت میں دستیاب ہے۔

6. ایبی فائن ریڈر Abby FineReader

Abby FineReader ایک PDF ایڈیٹنگ سافٹ ویئر ہے جس میں OCR کی خصوصیت بھی ہے۔ فی الحال، اس کے OCR میں اردو زبان کی حمایت نہیں ہے۔ تاہم، کچھ ماہرین نے عربی زبان کو منتخب کر کے اردو متن کی شناخت کے لیے اس سافٹ ویئر کو تربیت دینے کا تجربہ کیا۔ یہ عمل قدرے پیچیدہ تھا، اور حاصل کردہ نتائج مکمل طور پر درست نہیں تھے، تاہم، وہ Abby FineReader کا استعمال کرتے ہوئے ہاتھ سے لکھے ہوئے اردو متن کو اچھی طرح سے پہچاننے میں کامیاب رہے۔ سب سے زیادہ فائدہ مند بات یہ ہے کہ OCR ٹول کو ماہرین اس کی درستگی کو بہتر بنانے کے لیے دستی طور پر تربیت دے سکتے ہیں۔

یہ تجربات ورژن 8 پر جناب علوی امجد کے ذریعے کیے گئے (تفصیل یہاں)، اور ورژن 12 پر جناب ظہیر عباس (تفصیل یہاں) کے ذریعے کیے گئے، جب کہ اس کا تازہ ترین ورژن 15 دستیاب ہے جو فارسی زبان کو بھی سپورٹ کرتا ہے۔ اس لیے امید ہے کہ ایبی فائن ریڈر مستقبل میں اردو متن کی پہچان کے لیے ایک حل کے طور پر دستیاب ہو سکتا ہے۔

قیمت کا تعین: Abby FineReader v15 کو 199€ (تقریباً 40,000 PKR) کی کافی قیمت پر خریدا جا سکتا ہے۔

6. Texify Bot/ Matnyaar

Texify Bot ایک ٹیلیگرام بوٹ ہے جو اسے بھیجی گئی تصویر سے متن نکالتا ہے۔ OCR فیچر چار زبانوں کو سپورٹ کرتا ہے: فارسی، انگریزی، روسی اور فرانسیسی۔ اردو اور فارسی میں مماثلت کی وجہ سے، یہ اردو متن پر مشتمل تصویر کے لیے بھی اچھے نتائج دیتا ہے۔ ایک فارسی OCR Matnyaar اس ٹیلی گرام بوٹ کے پیچھے کام کرنے والا سافٹ ویئر ہے، جو ایک Android ایپ اور ایک ویب ایپلیکیشن کے طور پر بھی دستیاب ہے۔

قیمت کا تعین: چند تصاویر کے لیے، Texify Bot مفت میں استعمال کیا جا سکتا ہے، لیکن ایک بڑی تعداد کے لیے، مختلف قیمتوں کا Matnyaar پیکیج خریدا جانا چاہیے۔

Header Ads Widget

2022 میں دستیاب 7 اردو OCR سافٹ ویئر کا تجزیہ