یکشنبه, نوومبر 24, 2024
Homeټولنیزله لیکنیز متن څخه د وینا د بڼې تکنالوژي

له لیکنیز متن څخه د وینا د بڼې تکنالوژي

لیکنه: انجنیر قیس کبیر

ژباړه: دودیال

Text to speech

د ژبی سنتیز تر هرڅه دمخه د هغو ړندو خلکو او هغه چا لپاره چې له یوه پرمختللی چاپیریال سره یې په ژبه باندې د خبرو کولو ستونزه لرله، رامنځته شو. په دې وروستیو کلونو کې د کمپیوټر د تکنالوژۍ له ګړندي پرمختګ سره یوځای په دې کې نورې برخې هم رامنځته شوې؛ لکه: د ایمیلونو(بریښنالیکونو) لوستل، په تیره بیا د موټر د چلولو پر مهال، د الوتکو د الوتنې په اړه معلومات (هوایی ډګرونو کې د الوتنې د ځای، وخت او نور معلومات)، په نویګشن سیستم یا بریښنایی لارښودونو او بریښنایی زده کړو (e learning) او نورو کې.

په دې وروستیو کې په بریښنایی کتابوکې د(Text to speech TTS) تکنالوژي دهغو د لوستلو په موخه ادغام شوی ده، چې دې ته ” له لیکنې څخه وینا ته اووښتې ” تکنالوژی ویل کیږي.

زموږ په ملی ژبو کې له دغې تکنالوژی څخه کار اخیستل، یوه ستندرد معیار ته اړتیا لري چې په دې ډول سره به یو ماشین دا توانایی ولری چې اړونده ژبه روانه ولوستلای شي.

د دې موضوع د ښه پوهیدو لپاره چې زموږ ملی ژبو پورې هم اړه پیدا کوي، باید دغه سیستم له تخنیکی پلوه په لنډ ډول توضیح او تشریح شي. هغه کسان چې دې موضوع سره لازیاته لیوالتیا لري، کولای شی په دې هکله له بیلابیلو پوهنتونو او علمی –څیړنیزو مرکزونو څخه تفصیلی معلومات تر لاسه کړي.

له لیکنې څخه وینا ته اووښتې تکنالوژي(Text to speech) کې، مخکې تر دې چې هر توری په غږ واوړي، یوې پیچلې تخنیکی پروسې ته اړتیا ده چې لاندني  بیلابیل ګامونه لري:

۱.په یوه ډیټابیس کې د طبیعی غږ ثبتول: د هغوتورو د طبیعی غږ د جوړښت په خاطر چې د انسان له ژبې اوریدل کیږی، باید دهغه غږ ټول تونونه یا دغږآهنګ، په غوره شوی ژبه کې د معیاری لهجی سره ثبت شي (باید پاملرنه وشی چی د الفبې غږونه په ډیټا بیس کې فقط یوځل د تورو د پیژندنې په موخه، د هغو له بیلابیلو واولونو”فتحه، کسرې، پیښ او تنوین” سره ثبت او زیرمه کیږي). نور نو بیا ضرور نده چې د کتاب، هره لیکنه او هر متن  اود تورو(حروفو) غږونه بیا ځلي ډیټا بیس کې خوندي شی. (هره لیکنه او متن د غږ په بڼه اوریدل کیدای شي).

  • ثبت شوي غږونه په بیلابیلو کټګوریو کې “دغږونو د ډیټابیس” په برخه کی زیرمه کیږي.

۲.په غږ (Sound) باندې د متن(ټکسټ) بدلول: لومړی د دې لپاره چې دغږ زیر او بم او سم تلفظ وټاکل شی، باید اړوند سافتویرلیکنه؛ تجزیه، تحلیل، تفسیر او وشنی. د دې موخې لپاره موجوده متن (ټکسټ) له الګوریټم۱ څخه په کار اخیستوسره په کوچنیو او لا کوچنیو واحدونو او برخو (لکه کلمات، بیا کلمات په تورواو بیا هر توری په هجا او داسی نور) تجزیه او شنل کیږی او ترنورو کوچنیو برخو (ټکی، کامه، ندائیه، سوالبه…) پورې رسیږی. وروسته بیا د کلماتو تلفظ ټاکل کیږی او او په ژبنی جوړښت کتنه کیږي.

وروسته بیا له الګوریتم څخه په کار اخیستو سره میتیماتیک له( بی غږه ډیټا Voice database) څخه غږ غوره کیږی.

د یادونې وړ  ده چې د تکنالوژي دغه نوې ښکارنده، د متنونو او کتابونو د مطالعې د آسانی لپاره ده چې سترګی نه ستومانه کوي. 

د دې لپاره چې د یوې ژبې متن د دې امکانات تر لاسه کړی چې له لیکنیز بڼې په غږیزه بڼه واوړي، نوضروری ده چې نوموړی ژبه باید د یوه تثبیت شوی ستندرد لرونکي او  غوره انشا، املا او تلفظ ولری.

د انشا اهمیت

لکه څرنګه چې پورته وویل شول، مخکې تر دې چې متن په غږ (Sound) واړول شي، باید هغه په کوچنیو برخو تجزیه شی. هجا په ژبه کې د کلماتو تون(آهنګ) ټاکی او کامه د لږ ځنډ(دمې) نښه ده. مثلاً  کامه، سیمی کولن؛ فاصله- سوالیه؟ ندایه! او شارحه: او نور علایم چې هره یوه یی د کلماتو په طرز (میلودی) باندې اغیزه لري. په دې ډول سره انشا خپله اغیزه پر متن او وروسته بیا پر آهنګ باندی اغیزه او حساسیت څرګندوي او اړونده میلودی ثبیت کیږي.

انشا یو مهم رول لري. په ټکیو سره د یوې جملې د پیل او پای تشخیص کول او پیژندنه، له جملې څخه د کلماتو جلا کول، د دوو کلماتو تر منځ د تشیال په واسطه ښودل کیږي. حرفونو (تورو) باندی د کلماتو تجزیه کول د ژبنیز الګوریتم په واسطه کیدای شي.

د املا اهمیت

له بده مرغه د افغانستان ملی ژبې د نوی تکنالوژۍ په ډګر کې په یواځیتوب سره د اوسنی یوویشتمی پیړی غوښتنو ته ځواب نشی ویلای. دا ځکه چې که د غږونو د سم ټاکلو لپاره دعربی ژبې له ځانګړنو (فتحی، کسری، پېښ، ضمې، تنوین، تشدید او نورو) څخه کار وانخیستل شي، نو د غږ اهنګ به اوچته جوت نشی او مفهوم به سم ادا نشی. د بیلګې په توګه که بلخ او مَلَخ  که چیری په کسرې او فتحې( زیر او زبر) سره په نښه نشي، دهغو توپیر کول به ستونزمن وي. 

دسم لوستلو په خاطر باید د غږ (Sound) په ډیتا بیس کې ټول ترکیبات خوندي شي او په املا کې هم باید په پام کې ونیول شي.

یادونه:

د کلماتو تر منځ د فاصلی ایښودل یا دهغې له منځه وړل د لویو تیروتنو لامل ګرځیدای شی. مثلاً : د

“زړه ورکړ” او “زړه  ورکړ ” ترمنځ لږ واټن راوستل او نه راوستل دتیر وتنی لامل ګرځیدای شی.

زموږ په ژبو کې د لیکدود له نښو(زور، غړوندی، پېښ…) څخه د کار اخیستو موخه داده چې په هر ځای او ټولو کلماتو کې د لیکنی پر مهال د استفادی کولو امکان ولری، خو په هغو حالاتو کې چې اړتیا پېښه شی، لکه  ځنې، ځینی، لور ، لور، سر ، سُر او نورو کی یا په ډول(دهل) او ډول (نوع)کې  چې دا هر مثال په خبرو کولو کی د متن او (له لیکنی څخه د وینا)د آسانتیا د سیستم لپاره دی ډیتا بیس باید په همدې نښو سره وپیژندل شی، ترڅو لفظی ستونزې پېښې نشي .

د تلفظ اهمیت

لکه څرنګه چې پوهیږو، د نړۍ زیاتره هیوادونه په یوه واحد ملت کې ګڼ شمیر قومونه، ژبې او بیلابیلې لهجی لري. دغه قومونه هم بیاهر یو یی په خپلو ژبو کې بیلابیلی لهجی لری، زیاتره وخت د یوې سیمی خلک د بلی سیمی خلکو سره په خبره پوهیدای شی، له همدې امله تقریباً دنړۍ زیات شمیر هیوادونه دخپلو ډیرو ژبو او لهجو ترڅنګ، یوه عمومی  ستندر رسمی ژبه لری چې ټول رسمی ، رسنیز او دفتری چاری او د ښوونځیو او پوهنتونو تدریس یی په هماغو ستندردونو پر مخ بیول کیږي.

په بله وینا: ستندرد ژبه په یوهیواد کې، په حقیقت کی، تر هرڅه دمخه د ولایاتو او سیمو د وګړو ترمنځ د مکالمی وسیله ده او تر څنګ یې د دوی د ملت جوړونی  په برخه کی اهمیت لری او دوهم ګام کې دا ژبه له نوری بهرنۍ نړۍ سره د دوی د مکالمی وسیله ده.

زموږ په ګران هیواد کی هم بیلابیلی لهجی  شته ، دبیلګی په توګه د دری نامتو لهجی دا دي:

هراتی، بدخشی، مزاری، کابلی، لوگری، سرخرودی ننگرهار، لغمانی، پنجشیری.

په پښتو ژبه کې هم لهجی لرو لکه: د قندهار، پکتیا، پکتیکا، وردک، ننگرهار و لوگر لهجی او نور.

البته د ستندرد کیدو په خاطر دلهجی غوره کول  تر هرڅه دمخه د یوهیواد د دولت لومړیتوب او ملی اهمیت دی چې ورسره د څیړنیزو موسساتو اود تکنالوژي د متخصصینو، ادب پوهانو، زبپوهانو او نورو مسئولیت دی. د اطلاعاتو او حقوقی او قانونی دلایلو له مخې هم باید قانع کوونکی وی، د بیلګی په توګه په دری یا پښتو ژبه کی  باید دا مسئله د اکثریت په پام کی نیولو سره تر سره شی.

درنو لوستونکو،  څرنګه چې لیدل کیږي، په لیکنیز بڼه د متن راوستلو په خاطر یوه پروسه ضروری ده چې په تکنالوژی سره ترسره کیږی. موږ افغانان کولای شو چې لیکنی د یوې کاري وسیلی په توګه د سافتویر په بڼه د دولت په ملاتړ، دیوې اړونده کمپنۍ  په واسطه پرمخ بوځو، ترڅو وتوانیږو چې ورکړل شوی لیکلی متن له املایی ، انشایی او آن له ګرامری پلوه تصحیح او نامانوس کلمات اصلاح او له خپلو ژبو څخه ورته مناسب کلمات غوره کړو. 

د دې موخې لپاره د آسانتیا په خاطر موږ کولا ی شو چې ” د افغانستان لوی قاموس ” څخه کار واخلو. د ژبې ستندرد کول زموږ کار نه دی، بلکې دا  د یوه سره پیوست مثلث( ملی حکومت، ژبپوهانو او د مډرنی اطلاعاتی تکنالوژۍ دمتخصصینو) کار دی ترڅو وکولای شی چې په سم او تخنیکی ډول سره دغو ټولو ستونزمنو چارو او اړتیاوو ته ځواب ووایي. تر اوسه پورې دا د افغانسنتان د ژبې او ادب د پرمختګ په لاره کی یوه ستونزه ده، زموږ ځوان کول ته بویه چې دا چاره تر سره کړي.

دا چې ایا د ژبې د ستندرد کولو په خاطر باید له کومو معیارونو څخه او په کومو لارو سره کار واخلو، دا ډیره مهمه ده. دا کار هم باید د ادیبانو، لیکوالو او زموږ د خپلو افغان کارپوهانو له خوا، دپردیو، غیر ملی او ګاونډیو له لاسوهنو پرته ترسره شي.

اطلاعاتی نوی تکنالوژی کی زموږ د ملی ژبو  بشپړ ادغام او پرمختګ ورکول:

  • د دري ژبې په کیبورډ سره ددخولی ژبی ادغام(پښتو یې شته) اوپه کمپیوتری آپریتینګ سیستم (لکه وینډوز، ایپل، لینوکس/یونیکس او نورو)کی  د هغی شاملول،
  • ګرځنده تیلفونو کې په آپریتینګ سیستم او(سمارت فون) کې ادغامول،
  • په مایکروسافت آفیس او نورو سافتویرونو کی یی ادغامول،
  • د املا، انشا او نورو اصلاحاتو ترسره کول او سیندګیو ته پرمختیا ورکول،
  • له لیکنی بڼې څخه وینا ته د اړولو تکنالوژۍ ته پرمختیا ورکول،
  • او یو شمیر نوری چاری.

وروستیو دوام لرونکو جګړو، له موږ څه ډیرفرصتونه له لاسه وایستل . په تیره بیا نویمی لسیزی کې، چې نوره نړۍ له صنعتی ټولنې څخه یوې اطلاعاتی ټولنی باندی بدله شوه، خو په افغانستان کې د ګاونډیو نیابتی  جنګونه وو او په دې وروستۍ لسیزه کی د ایران ترفرهنګی یرغل لاندې راغلو.

اوس زموږ هیواد د تکنالوژیکی پرمختګ له کاروان څخه دومره وروسته پاتې دی چې که چیری زموږ درې نسلونه؛ یعنی ژبپوه مشران، منځوی نسل( چې د پخوانی نسل او ځوانانو ترمنځ یوه د وصل کړۍ ده) او ځوانان چې تکنالوژي باندې لاسرسی لری، ښځینه او نارینه په ګډه ټول باید دغه نیمګړتیا پوره کړی. که همدا نن دا کار ونشی سبا به ډیره ناوخته وي.

و به ګورو چې د دغه مهم هدف د ترلاسه کولو په خاطر به، په فردی او ټولیز ډول زموږ رول څومره اغیزمن وی؟

د دې موخې لپاره څو ټکی مهم دي:

  • د پوهانو او مشرانو ژبپوهانو یووالی، پرته له هر ډول قومی، سیاسی، شخصی او نورو اختلافاتو څخه،
  • د ملی ژبو د ستندرد کولو له طریقو څخه ددوی ملاتړ او د ژبو د بډایه زیرمو د لیږد په خاطر اقلاً یو ځل د دوی یوموټی کیدل، ترڅو له دغه موجود نسل څخه ځوانانو ته دغه مهم ملی امانت ورسول شی،
  • دغې موخې ته درسیدو په خاطر باید د پردیو ژبو له کلمو څخه کار وانخلو، دا کار به په مډرنه تکنالوژی کې زموږ د ملی ژبو د پرمختیا په لاره کې خنډ شی،
  • باید نه ستومانه کیدونکی  هلی- ځلې وشی ترڅو په اطلاعاتی تکنالوژی کی خپلی ملی ژبی ادغام کړو،
  • د ژبې په ستندرد کولو کې دسلیقوی مصلحتونو مخه باید ونیول شی ، دا ځکه چې د یو هیواد د ژبو په چاپیریال کې  د بیلابیلو سلیقو شتون په خپله فرهنګی افتراقات څرګندوي او د وحدت د مثلث د ضعف او نیمګړی کیدو لامل ګرځي.

ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ  

1
الگوریتمhttp://en.wikipedia.org/wiki/Algorithm

دمقالې لیکوال KITد په پوهنتون کې د تکنالوژی لپاره د کارلسرو په انستیتیتوت کې د الکترو تخنیک په څانګه کې زده کړې کړي دي او اوس د دیپلوم انجنیر په توګه د زیمنس  Siemens AG په کمپنی کې د اتو میشن سیستم   Automation System په چارو کې کار کوي . له دې سره یوځای د میکرو سافت  MCSEد سیستم انجنیر دی او د MSDNدپرمختیایی شبکې غړیتوب لري. د مقالې لیکوال د افغان جرمن انلاین دپورتال دمتصدی دنده هم په غاړه لري.  

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisment -

ادب