1. ወደ ይዘቱ ዝለል
  2. ወደ ዋናዉ ገፅ ዝለል
  3. ወደ ተጨማሪ የDW ድረ-ገፅ ዝለል

በሰው ሰራሽ አስተውሎት ላይ የተመሰረቱ ቴክኖሎጂዎች የቋንቋ ክፍተት

ረቡዕ፣ ነሐሴ 17 2015

በሰው ሰራሽ አስተውሎት ላይ የተመሰረቱ ዲጅታል አገልግሎቶች በአሁኑ ወቅት ምርታማነትን እና ቅልጥፍናን በመጨመር ዘርፈ ብዙ ጥቅም እየሰጡ ይገኛሉ።ነገር ግን የማሽን ትርጉም ለአንዳንድ የአፍሪቃ ቋንቋዎች አስቸጋሪ ነው።ለምሳሌ ከሌሎች ቋንቋዎች ወደ አማርኛ የሚመለሱ የጉግል ተርጓሜን ብንወስድ በወጉ የተደራጄ አይደለም።

Google Translate
ምስል Pavlo Gonchar/Zuma/picture alliance

በሰው ሰራሽ አስተውሎት የተመሰረቱ ቴክኖሎጅዎች የቋንቋ ክፍተት

This browser does not support the audio element.


የዛሬው የሳይንስ እና ቴክኖሎጅ ዝግጅት በሰው ሰራሽ አስተውሎት ላይ በተመሰረቱ ዲጅታል አገልግሎቶች ላይ የሚታይን የቋንቋ ክፍተት እና ችግሩን ለመፍታት የሚደረጉ አንዳንድ ጥረቶችን ይዳስሳል። 
ሰው ሰራሽ አስተውሎት/artificial intelligence/ በአሁኑ ወቅት በትምህርት፣ በኢንዱስትሪ፣ በጤና፣በደህንነት እና በግብርና ዘርፎች ቁልፍ ቴክኖሎጂ ሆኖ እያገለገለ ነው።
እንደ ቻት ጂፒቲ/ ChatGPT/  እና የጉግል ትርጉም/Google Translate/ ያሉ  በሰው ሰራሽ አስተውሎት ላይ የተመሰረቱ ዲጅታል አገልግሎቶችም በአሁኑ ወቅት ምርታማነትን እና ቅልጥፍናን በመጨመር ዘርፈ ብዙ ጥቅም እየሰጡ ይገኛሉ።

ሰው ሰራሽ አስተውሎት በአሁኑ ወቅት በትምህርት፣ በኢንዱስትሪ፣ በጤና፣በደህንነት እና በግብርና ዘርፎች ቁልፍ ቴክኖሎጂ ሆኖ እያገለገለ ነው።ምስል imago images/Imaginechina-Tuchong

ነገር ግን ዲጅታል መድረኮቹ በምዕራባውያን ቋንቋዎች የተቃኙ በመሆናቸው አገልግሎቱ ውጤታማ የሚሆነው  የተጠቃሚው ቋንቋ በእነዚህ ዲጅታል መድረኮች የሚደገፍ ከሆነ ነው።ከዚህ አንፃር የማሽን ትርጉም ለአንዳንድ የአፍሪቃ ቋንቋዎች አስቸጋሪ ነው።ለምሳሌ  ከሌሎች ቋንቋዎች ወደ አማርኛ የሚመለሱ የጉግል ተርጓሜን ብንወስድ በወጉ የተደራጄ አይደለም።በዚህ የተነሳ ሰዎች አንዳንድ ሰነዶቻቸውን ለትርጉም ባለሙያዎች ከፍለው  እንዲተረጎም ያደርጋሉ።በአዲስ አበባ ከተማ አሻጋሪ የተባለው አማካሪ ድርጅት መስራች የሆኑት መቅደስ ገብረወልድ ችግሩን ይጋሩታል።የእሳቸው ድርጅት  እነዚህን አገልግሎቶች ለተለያዩ ጉዳዮች ይጠቀማል ነገር ግን በአማርኛ ውጤታማ ሆኖ አላገኙትም።በዚህ የተነሳ ከማሽን ትርጉም ይልቅ የሰው ሀይልን መጠቀም መርጠዋል።የሰው ሰራሽ አስተውሎት ቴክኖሎጅ ዕድል እና ፈተና
በዚህ ሁኔታ እንደ መቅደስ ገብረወልድ ያሉ በቢሊዮን የሚቆጠሩ ሰዎች በቋንቋቸው ምክንያት በሰው ሰራሽ አስተውሎት ላይ የተመሰረቱ ዲጅታል መድረኮችን መጠቀም አልቻሉም።

ቻት ጂፒቲ ፤ የመረጃ መፈለጊያ ዲጅታል መድረክ፤ የሰው ሰራሽ አስተውሎት የቋንቋ ክፍተት እንደ ቻት ጂፒቲ እና የጉግል ትርጓሜ ላሉ ዲጂታል አገልግሎቶች ችግር እየፈጠረ ነው።ምስል Avishek Das/SOPA Images via ZUMA Press Wire/picture alliance

ይህም እንደ ቻት ጂፒቲ /ChatGPT/ እና የጉግል ትርጓሜ ላሉ አገልግሎቶች ብቻ ሳይሆን ድምፅን ወደፅሁፍ ለሚቀይሩ እና በድምፅ እርዳታ ለሚሰሩ ዲጂታል አገልግሎቶች እንዲሁም  በማህበራዊ መገናኛ ዘዴዎች ላይ ለሚሰራጩ ይዘቶችም ችግር እየፈጠረ ነው።የመረጃ ፍለጋን ያቀለለው ቻትጂፒቲ
በሰው ሰራሽ አስተውሎት ላይ የተመሰረቱ ዘመናዊ ዲጅታል አገልግሎቶችን ስንመለከት  በተሰጣቸው ግብዓት ላይ ተመርኩዘው መልስ የሚሰጡ፣ የሚተነብዩ እና ያለሰው እገዛ በራሳቸው የሚሰሩ ናቸው።ይህ ትንበያ የሰውሰራሽ አስተውሎት መሀንዲሶች ሞዴሎቻቸውን ለመገንባት በሚጠቀሙባቸው ዲጂታል የይዘት ስብስቦች አማካኝነት በሚሰጣቸው እጅግ በርካታ«የስልጠና መረጃ» ላይ የተመሰረተ ነው።  
ከሥልጠና መረጃ ምንጮች መካከል  ኮመን ክራውል/Common Crawl/  የሚባለው አንዱ ነው።  ይህ የመረጃ ምንጭ በበይነመረብ ላይ የሚገኙ በቢሊዮን የሚቆጠሩ ድረ-ገጾችን ያቀፈ ክፍት የውሂብ ስብስብ ነው።ለአብነትም  3.5 የሚባለውን የቻት ጂፒቲ/ChatGPT/ስሪትን ለማሰልጠን ጥቅም ላይ ከዋለው መረጃ 60% ያህሉ ከዚህ ስብስብ ውስጥ የተወሰደ ነው።

በሰው ሰራሽ አስተውሎት ላይ የተመሰረቱ ዘመናዊ ዲጅታል አገልግሎቶችን በተሰጣቸው ግብዓት ላይ ተመርኩዘው መልስ የሚሰጡ፣ የሚተነብዩ እና ያለሰው እገዛ በራሳቸው የሚሰሩ ናቸው።ይህ ትንበያ የሰውሰራሽ አስተውሎት መሀንዲሶች በሚሰxጧቸው የስልጠና መረጃ ላይ የተመሰረተ ነው።  ምስል Alexander Limbach/Zoonar/picture alliance

ገር ግን፣ በዚህ ሥልጠና  በአንድ ቋንቋ  ላይ ያለው መረጃ አነስተኛ ከሆነ ውጤታማ ስራ መስራት አይቻልም።በይነመረቡ የተያዘው ደግሞ በጥቂት የምዕራባውያን ቋንቋዎች በመሆኑ  ከዚህ መረጃ ቋት /Common Crawl /ውስጥ እንግሊዘኛ ብቻ ግማሽ ያህሉን ይይዛል።
የአማርኛ ዲጂታል መረጃ ከሌሎች የአፍሪካ፣ የአሜሪካ  እና የኦሺኒያ ቋንቋዎች ጋር በመሆን ከ 0.1% ያነሰ ነው። ከዚህ አኳያ አነስተኛ ዲጂታል መረጃ ያለው  የግብዓት ቋንቋ ነው። 
መቅደስ እንደሚሉት እንደ ሌሎቹ ቋንቋዎች ለአማርኛም ትኩረት ቢሰጠው  የተሳካ ስራ መስራት ይቻላል።
በዓለም ዙሪያ፣ በቢሊዮን የሚቆጠሩ ሰዎች እነዚህን ዝቅተኛ ግብዓት ያላቸውን ቋንቋዎች ይናገራሉ። ይህም እንደ ሂንዱ፣ አረብኛ እና ቤንጋሊ ያሉ ዋና ዋና ቋንቋዎችን ያካትታል።የአውሮፓ ቋንቋዎች ከአብዛኞቹ የእስያ እና የአፍሪቃ ሀገሮች ጋር ሲነፃፀሩ እጅግ በጣም ብዙ ዲጂታል መረጃ አላቸው።
ለምሳሌ ደች የተባለው የሆላንድ ቋንቋ ከአማርኛ ባነሰ 20 ሚሊዮን በላይ ሰዎች እንደ መጀመሪያ ቋንቋ ይናገሩታል። ሆኖም የደች ቋንቋ  የውሂብ  ስብስብ ወደ 700 ጊዜ እጥፍ  ነው። ይህም ከ300 ሚሊዮን በላይ ሰዎች አፍ ከፈቱበት የሂንዱ ቋንቋ  በመቶዎች  ጊዜ ይበልጣል።
ከአንድ ሚሊዮን በላይ ተጠቃሚዎች ያሏቸውን ጨምሮ በዓለም ዙሪያ በሺዎች የሚቆጠሩ ቋንቋዎች አነስተኛ ይዘቶች እና ጥቂት  ዲጂታል ውሂብ ያላቸው ናቸው።
ይህንን የውሂብ እጥረት ለመፍታት ታዲያ ከግዙፉ ከሲሊኮን ቫሊ ቴክኖሎጂ  ባሻገር፣ በመላው ዓለም ተመራማሪዎች ቋንቋቸውን በሰውሰራሽ አስተውሎት  ለማጎልበት ይሰራሉ። ከነዚህም መካከል አስመላሽ ተካ ሃድጉ አንዱ ነው።
አስመላሽ ለኢትዮጵያ ቋንቋዎች በማሽን የትርጉም አገልግሎት የሚሰጠው ልሳንልሳን የተባለው ዲጅታል የትርጉም አገልግሎት ሰጭ የቴክኖሎጂ ኩባንያ መስራች ነው።ይህ ዲጅታል መድረክ የሰውሰራሽ አስተውሎት የቋንቋ ክፍተትን  ለመሙላት በሁለት የኢትዮጵያ ቋንቋዎች ማለትም በአማርኛ እና በትግርኛ  የማሽን ትርጉም አገልግሎት  ይሰጣል።

የልሳን ዋና ሥራ አስፈፃሚ አዳም ቡድዌይን እና የልሳን መስራች አስመላሽ ተካ ሀድጎ /ከግራ ወደ ቀኝ/ልሳን በሁለት የኢትዮጵያ ቋንቋዎች ማለትም በአማርኛ እና በትግርኛ በማሽን የትርጉም አገልግሎት የሚሰጥ ዲጅታል መድረክ ነው። ምስል Lesan

እሱ እና ባልደረቦቹ  በርካታ የበይነመረብ  ግብዓቶችን ለማግኜት በቀጥታ ከማህበረሰቡ ጋር ይሰራሉ። ውሂብ ለመሰብሰብም የፈጠራ መንገዶችን ይጠቀማሉ።
«የምንሰራው ከማህበረሰቡ አባላት ጋር  ነው ። ታውቃላችሁ ትርጉም መስራት ሲኖርብን በቋንቋችን ይዘትን ለመሰብሰብ ተግባራትን ለይተን አስቀምጠናል ። ለመርዳት ያህልም ምናልባት አንዳንድ ሰው ሰራሽ መረጃዎችን እንፈጥራለን። ከዚያ እነዚህን ነገሮች ለማስተካከል ወደ ማህበረሰቡ መልሰን እንልከዋለን። ስለዚህ ከማህበረሰቡ አባላት ጋር በመተባበር ይህንን እንዴት መሰብሰብ እንደምንችል የፈጠራ መንገዶችን አዘጋጅተናል። ይህንን አይነት መረጃ የምንፈጥረው ከማህበረሰብ አባላት ጋር በመተባበር ነው ።»
አስመላሽ እንደሚገልፀው ቋንቋቸውን በሚወዱ  ፈቃደኛ ተማሪዎች ጭምር በክፍያ መረጃ ይሰበስባል።ይህ አሰራር ብዙ የሰው ሀይል  የሚጠይቅ ሲሆን፤ አስተዋጽዖ አበርካቾች መጀመሪያ እንደ መጽሐፍት ወይም ጋዜጦች ያሉ ከፍተኛ ጥራት ያላቸውን ታማኝ  የውሂብ ስብስቦችን ይለያሉ። ከዚያም ዲጂታላይዝ አድርገው ወደ ሚፈለገው  ቋንቋ ይተረጉሟቸዋል። በመጨረሻም፣የማሽን የመማር ሂደቱን ለመምራት ዋናውን እና የተተረጎመውን፤ ዓረፍተ ነገር በአረፍተ ነገር ያስተካክላሉ።

በሰው ሰራሽ አስተውሎት ላይ የተመሰረተው የጉግል ዲጅታል የትርጉም አገልግሎት ቅልጥፍናን በመጨመር ዘርፈ ብዙ ጥቅም እየሰጠ ይገኛሉ።ነገር ግን ዲጅታል መድረኩ ውጤታማ የሚሆነው  የተጠቃሚው ቋንቋ በዚህ ዲጅታል መድረክ የሚደገፍ ከሆነ ነው።ከዚህ አንፃር የማሽን ትርጉም ለአንዳንድ የአፍሪቃ ቋንቋዎች አስቸጋሪ ነው።ምስል Valentin Wolf/imageBROKER/picture alliance

ይህ የልሳን አካሄድ የተለዬ አይደለም። ልክ እንደ አስመላሽ ትናንሽ ዲጂታል አሻራዎች ላላቸው ቋንቋዎች ተመሳሳይ መርሀግብሮች  በመላው ዓለም በተሳካ ሁኔታ በመተግበር ላይ ናቸው።
 ሲል ኢንተርናሽናል በተባለው መንግሥታዊ ያልሆነ ድርጅት የሚተዳደረው ኢትኖሎግ የተሰኘው ዓለም አቀፍ የቋንቋዎች የውሂብ ቋት  አማርኛን «ጠቃሚ»  ድጋፍ ካላቸው ቋንቋዎች ዝርዝር መካከል አስቀምጦታል። ይህ ማለት ቢያንስ ቋንቋው አንዳንድ የማሽን የትርጉም አገልግሎቶች፣የፊደል ግድፈት  እና የንግግር ሂደት ማስተካከያዎች  አሉት ማለት ነው።
የአፍሪካ የሰው ሰራሽ አስተውሎት  አቅኚዎች ትስስር  አካል የሆነው አስመላሽ፤ ከአፍሪካ፣ አውሮፓ እና ሰሜን አሜሪካ የተውጣጡ የተመራማሪዎች ቡድን ባካተተው የሰው ሰራሽ አስተውሎት የጥናት ተቋም (DAIR) ባልደረባ ነው። እንደ ጋና ኤን ኤል ፒ/GhanaNLP/ እና እንደ ማሳክሃን ካሉ አፍሪቃዊው  መሰረት ካላቸው  ድርጅቶች ጋርም በመደበኛነት ይገናኛል።በመሆኑም «በአፍሪቃውያን የተመሰረቱ ቴክኖሎጂዎች ባለቤት መሆን እየቻልን  ነው።» ይላል። ይህም የተገነባው እና የሚያገለግለው የማህበረሰቡን አባላት በመሆኑ፤  የገንዘብ ገቢውም በቀጥታ  ወደ ማህበረሰቡ የሚመለስ ይሆናል።ሲል ለማህበረሰቡ ያለውን ጥቀሜታ ገልጿል።ከዚህ አንፃር ሀገር በቀል ድርጅቶችን ማበረታታት ጠቃሚ መሆኑን ያስረዳል።
«ተሰጥኦ ሁሉም ቦታ አለ።እድል ግን የለም።እና ስለዚህ ለጋና ቋንቋ ምርጥ የማሽን የትርጉም ቴክኖሎጂ ለመፍጠር ከተፈለገ ለዚያ ጽንሰ-ሐሳብ ጥልቅ ስሜት ያላቸው ጋናውያን  አሉ።ጥሩ አድርገው ይሰሩታል።ያንን እናበረታታ።»
ከአፍሪካ ውጭም የጃማይካ ፓቶይስን ጨምሮ በዓለም ዙሪያ ያሉ ተመራማሪዎች በሌሎች ቋንቋዎች ላይ እየሰሩ ነው።

ኦፕን ኤ አይ ፤ቻት ጂፒቲ የተሰኘውን ዲጂታል መድረክ የመሰረተ ግዙፍ የቴክኖሎጂዎች ኩባንያ ሲሆን ሞዴሎቹ ሚስጥራዊ እና የማይታወቁ ናቸው።ምስል Taidgh Barron/ZUMAPRESS.com/picture alliance

እንደ ቻት ጂፒቲው ኦፕን ኤ አይን / ChatGPT's OpenAI/ ያሉ ግዙፍ ቴክኖሎጂዎች ሞዴሎቻቸው ሚስጥራዊ እና የማይታወቁ ሲሆኑ፣ እንደ ዓለምአቀፉ የሰው ሰራሽ አስተውሎት  የጋራ ማቀፍ  ያሉት ደግሞ ግንዛቤዎችን በነፃነት ሲያጋሩ ቆይተዋል። ይህም  በቋንቋቸው መፍትሄ ማምጣት ለሚፈልጉ ተመራማሪዎች መንገዱን ቀላል ያደርገዋል።

ሙሉ ዝግጅቱን የድምፅ ማዕቀፉን ተጭነው ያድምጡ።

ፀሀይ ጫኔ/ኪራ ሻህት 
ማንተጋፍቶት ስለሺ

ቀጣዩን ክፍል ዝለለዉ የ DW ታላቅ ዘገባ

የ DW ታላቅ ዘገባ

ቀጣዩን ክፍል ዝለለዉ ተጨማሪ መረጃ ከ DW

ተጨማሪ መረጃ ከ DW