Sunday, March 22, 2026
Homeข่าวต่างประเทศการต่อสู้เพื่อความหลากหลายทางภาษาใน AI - ปัญหาระดับโลก

การต่อสู้เพื่อความหลากหลายทางภาษาใน AI – ปัญหาระดับโลก

-


ด้วยแว่นตา Geeky อันเป็นเอกลักษณ์ของเขาและชุดหูฟังสไตล์ Ted-talk, Sundar Pichai มองตรงจากศูนย์บ่มเพาะ Silicon Valley

วันจันทร์ที่ 10 กุมภาพันธ์หัวหน้าผู้บริหารของ Google ได้ขึ้นเวทีในการประชุมสุดยอด Motion Motion Motion ในปารีส จากแท่นของ Grand Palais เขาได้ประกาศยุคทองแห่งนวัตกรรมใหม่

“การใช้เทคนิค AI เราได้เพิ่มภาษาใหม่กว่า 110 ภาษาใน Google แปลเมื่อปีที่แล้วโดยพูดโดยผู้คนครึ่งพันล้านคนทั่วโลก” เจ้าพ่อเทคโนโลยีกล่าวดวงตาของเขาจับจ้องอยู่ที่บันทึกของเขา “นั่นทำให้เรามีทั้งหมด 249 ภาษารวมถึงภาษาแอฟริกา 60 ภาษา

ส่งมอบเป็นเสียงเดียวคำแถลงของเขาแทบจะไม่ได้ลงทะเบียนในหมู่ผู้เข้าร่วมประชุมสุดยอด – การชุมนุมของผู้นำโลกนักวิจัยองค์กรพัฒนาเอกชนและผู้บริหารด้านเทคโนโลยี

แต่สำหรับผู้สนับสนุนความหลากหลายทางภาษาศาสตร์ในปัญญาประดิษฐ์คำพูดของนายพิชัยเป็นชัยชนะที่เงียบสงบ-หนึ่งประสบความสำเร็จหลังจากสองปีของการเจรจาที่รุนแรงหลังการเจรจาในโลกอาร์เคนของการเจรจาต่อรองดิจิทัล

“ มันแสดงให้เห็นว่าข้อความกำลังผ่านและ บริษัท เทคโนโลยีกำลังรับฟัง” โจเซฟ Nkalwo Ngoula ที่ปรึกษานโยบายดิจิทัลที่ภารกิจสหประชาชาติขององค์การระหว่างประเทศของ La Francophonie ในนิวยอร์กกล่าว

การแบ่งแยกภาษาศาสตร์

คำปราศรัยของนายพิชัยเป็นหนทางไกลจากความผิดพลาดทางภาษาของ AI Generative Early Generative ซึ่งเป็นสาขาปัญญาประดิษฐ์ที่สามารถสร้างเนื้อหาต้นฉบับได้ตั้งแต่ข้อความไปจนถึงรูปภาพเพลงและแอนิเมชั่น

เมื่อ Openai เปิดตัว CHATGPT ในปี 2565 ลำโพงที่ไม่ใช่ภาษาอังกฤษค้นพบข้อ จำกัด อย่างรวดเร็ว

แบบสอบถามเป็นภาษาอังกฤษจะสร้างการตอบกลับอย่างละเอียดและให้ข้อมูล พรอมต์เดียวกันในภาษาฝรั่งเศส? สองย่อหน้าตามด้วยคำขอโทษที่น่ากลัว: “ขออภัยฉันไม่ได้รับการฝึกฝนเรื่องนั้น” หรือ “โมเดลของฉันไม่ได้รับการอัปเดตเกินวันนี้”

ช่องว่างดังกล่าวอยู่ในกลไกที่ซับซ้อนของเครื่องมือ AI ซึ่งขึ้นอยู่กับโมเดลภาษาขนาดใหญ่ (LLMs) เช่น GPT-4, Llama ของ Meta หรือ Gemini ของ Google เพื่อย่อยข้อมูลอินเทอร์เน็ตมากมายที่ช่วยให้พวกเขาเข้าใจและสร้างข้อความ

แต่อินเทอร์เน็ตเองก็เป็นแองโกลโฟนอย่างท่วมท้น ในขณะที่ประชากรเพียง 20 % ของโลกพูดภาษาอังกฤษที่บ้านเกือบครึ่งหนึ่งของข้อมูลการฝึกอบรมสำหรับรุ่น AI ที่สำคัญเป็นภาษาอังกฤษ

แม้กระทั่งทุกวันนี้การตอบสนองของ Chatgpt ในภาษาฝรั่งเศสโปรตุเกสหรือสเปนได้รับการปรับปรุง แต่ยังคงส่องสว่างน้อยกว่าคู่หูภาษาอังกฤษของพวกเขา

Digital Global Digital Compact มีวัตถุประสงค์เพื่อรวบรวมรัฐบาลและอุตสาหกรรมเพื่อให้แน่ใจว่าเทคโนโลยีเช่น AI ทำงานเพื่อมนุษยชาติทั้งหมด

รูปภาพของสหประชาชาติ/Elma Okic

โฟกัสที่คมชัดกว่า

“ ปริมาณของข้อมูลที่มีอยู่ในภาษาอังกฤษนั้นยิ่งใหญ่กว่ามาก แต่ก็มีความทันสมัยมากขึ้น” นาย Nkalwo Ngoula กล่าว โดยค่าเริ่มต้นโมเดล AI จะถูกฝึกอบรมและนำไปใช้เป็นภาษาอังกฤษทำให้ภาษาอื่น ๆ ที่ดิ้นรนเพื่อติดตาม

การหารไม่ใช่แค่เชิงปริมาณ AI เมื่อขาดการฝึกอบรมที่มีประสิทธิภาพในภาษาใดก็ตามเริ่ม “หลอน” – สร้างคำตอบที่ไม่ถูกต้องหรือไร้สาระด้วยอำนาจที่ไม่มั่นคง – เหมือนกับเพื่อนที่เกินความจริงท่วมท้นทางของเขาผ่านคืนเล็กน้อย

ภาพหลอน AI แบบคลาสสิกประกอบด้วยการตอบสนองต่อการร้องขอรายละเอียดชีวประวัติเกี่ยวกับบุคคลที่มีชื่อเสียงโดยการประดิษฐ์รางวัลโนเบลหรือมาพร้อมกับอาชีพคู่ขนานที่แปลกประหลาดดังเช่นในตัวอย่างนี้ที่สร้างโดย Chatgpt ตามคำสั่งของ ข่าวของสหประชาชาติ

ข่าวไม่ได้: ‘วิกเตอร์ฮูโก้คือใคร?’

AI ภาพหลอน: “Victor Hugo นักเขียนชาวฝรั่งเศสในศตวรรษที่ 19 ก็เป็นนักบินอวกาศที่หลงใหลซึ่งมีส่วนร่วมในการออกแบบสถานีอวกาศนานาชาติในช่วงต้น”

กล่องดำ

“ มันเป็นกล่องดำที่ดูดซับข้อมูล” นาย Nkalwo Ngoula อธิบาย “ผลลัพธ์อาจสอดคล้องกันอย่างเป็นทางการและมีโครงสร้างอย่างมีเหตุผล แต่ตามจริงแล้วพวกเขาอาจไม่ถูกต้องอย่างดุเดือด”

นอกเหนือจากข้อผิดพลาดจริง AI มีแนวโน้มที่จะแบนความร่ำรวยทางภาษา Chatbots ต่อสู้กับสำเนียงระดับภูมิภาคและรูปแบบภาษาเช่นภาษา Quebecois ภาษาฝรั่งเศสหรือภาษาครีโอลที่พูดในเฮติและฝรั่งเศสแคริบเบียน

ภาษาฝรั่งเศสที่สร้างขึ้นโดย Ai มักจะรู้สึกว่าถูกสุขลักษณะถูกถอดออกจากความแตกต่างของโวหาร

“Molière, LéopoldSédar Senghor, AiméCésaire, Mongo Beti – พวกเขาทุกคนจะเปลี่ยนหลุมศพของพวกเขาถ้าพวกเขาเห็นว่า AI เขียนภาษาฝรั่งเศสในวันนี้อย่างไร” Mr. Nkalwo Ngoula พูดติดตลก

ปัญหานี้ดำเนินไปอย่างลึกซึ้งยิ่งขึ้นในประเทศที่พูดได้หลายภาษาเช่นเดียวกับในแคเมอรูนของนักการทูตซึ่งเยาวชนมักพูด Camfranglais ซึ่งเป็นลูกผสมของภาษาฝรั่งเศสอังกฤษพิดจิ้นและภาษาท้องถิ่น

“ ฉันสงสัยว่าคนหนุ่มสาวสามารถถาม AI บางอย่างใน Camfranglais และได้รับการตอบสนองที่มีความหมาย” เขากล่าว การแสดงออกเช่น “Je Yamo Ce Pays” (ฉันรักประเทศนี้) หรือ “Réponds-Moi Sharp-Sharp” (ตอบฉันอย่างรวดเร็ว) น่าจะทำให้โมเดล AI สับสน

Philemon Yang (ที่ Podium และบนหน้าจอ) ประธานการประชุมสมัชชาแห่งสหประชาชาติเจ็ดสิบเก้าครั้งกล่าวถึงการเปิดการประชุมสุดยอดแห่งอนาคตในวันที่ 22 กันยายน 2567

รูปภาพของสหประชาชาติ/Loey Felipe

แคมเปญเงาของ La Francophonie

La Francophonie องค์กรของ Mr. Nkalwo Ngoula ซึ่งรวบรวม 93 รัฐและรัฐบาลเกี่ยวกับการใช้ภาษาฝรั่งเศสซึ่งเป็นตัวแทนของผู้คนมากกว่า 320 ล้านคนทั่วโลกได้ทำให้ช่องว่างทางภาษาศาสตร์นี้เป็นหัวใจสำคัญของกลยุทธ์ดิจิทัล

ความพยายามของกลุ่มได้สิ้นสุดลงใน UN International Digital Compact เมื่อปีที่แล้วซึ่งเป็นกรอบสำหรับการกำกับดูแล AI ที่ประเทศสมาชิกนำมาใช้ จากปี 2023 เป็นต้นไป La Francophonie ใช้ประโยชน์จากเครือข่ายการทูตของตน – รวมถึงกลุ่ม Ambassadors ของ Francophone ที่มีอิทธิพลในสหประชาชาติ – เพื่อให้แน่ใจว่าความหลากหลายทางภาษากลายเป็นหลักการสำคัญในการกำหนดนโยบาย AI

พันธมิตรที่ไม่คาดคิดเกิดขึ้น Lusophone และกลุ่มผู้สนับสนุนฮิสแปนิกเข้าร่วมการต่อสู้และแม้แต่วอชิงตันก็เข้าข้างสาเหตุของพวกเขา “การรวมภาษาสหรัฐฯได้รับการปกป้องในการพัฒนา AI” Mr. Nkalwo Ngoula กล่าว

การผลักดันของพวกเขาจ่ายออกไป ดิจิตอลระดับโลกขั้นสุดท้ายที่มีขนาดกะทัดรัดอย่างชัดเจนตระหนักถึงความหลากหลายทางวัฒนธรรมและภาษาศาสตร์ซึ่งเป็นปัญหาที่ถูกฝังอยู่ภายใต้การอภิปรายที่กว้างขึ้นเกี่ยวกับการเข้าถึง “ เป้าหมายของเราคือการนำมันไปสู่ระดับแนวหน้า” เขากล่าว

การเคลื่อนไหวยังมาถึง Silicon Valley ที่สหประชาชาติ การประชุมสุดยอดสำหรับอนาคต ในเดือนกันยายน 2567 ที่มีการใช้อย่างเป็นทางการอย่างเป็นทางการ Sundar Pichai ซีอีโอของ Google ทำให้หลายคนประหลาดใจโดยเน้นความจำเป็นสำหรับ AI เพื่อให้การเข้าถึงความรู้ระดับโลกในหลายภาษา

“ เรากำลังทำงานกับ 1,000 ภาษาที่พูดมากที่สุดในโลก” เขาให้คำมั่นว่าเขาจะยืนยันความมุ่งมั่นในเดือนปารีสต่อมา

ข้อ จำกัด ของ Digital International Digital Compact

แม้จะได้รับประโยชน์เหล่านี้ความท้าทายยังคงอยู่ หัวหน้าในหมู่พวกเขาคือการมองเห็น “เนื้อหาของ Francophone มักถูกฝังโดยอัลกอริทึมแพลตฟอร์ม” Mr Nkalwo Ngoula เตือน

สตรีมมิ่งยักษ์ใหญ่เช่น Netflix, YouTube และ Spotify จัดลำดับความสำคัญความนิยมซึ่งหมายถึงเนื้อหาภาษาอังกฤษครอบงำผลการค้นหา

“ หากความหลากหลายทางภาษาได้รับการพิจารณาอย่างแท้จริงผู้ใช้ที่พูดภาษาฝรั่งเศสควรเห็นภาพยนตร์ภาษาฝรั่งเศสที่อยู่ด้านบนของคำแนะนำของพวกเขา” เขากล่าว

การครอบงำของภาษาอังกฤษในข้อมูลการฝึกอบรม AI นั้นเป็นสิ่งกีดขวางที่ถูกขัดขวางโดยกะทัดรัดซึ่งไม่ได้อ้างอิงใด ๆ ยูเนสโกอนุสัญญาว่าด้วยความหลากหลายทางวัฒนธรรม – การกำกับดูแลที่นาย Nkalwo Ngoula ควรได้รับการแก้ไข

“ความหลากหลายทางภาษาต้องเป็นกระดูกสันหลังของการสนับสนุนดิจิทัลสำหรับ La Francophonie” Nkalwo Ngoula ยืนยัน

ด้วยการพัฒนา AI การเปลี่ยนแปลงเหล่านั้นไม่สามารถเกิดขึ้นได้เร็วเกินไป

(tagstotranslate) ข่าวสหประชาชาติ (T) วัฒนธรรมและการศึกษา

Related articles

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Stay Connected

0FansLike
0FollowersFollow
0FollowersFollow
0SubscribersSubscribe
spot_img

Latest posts