ข่าวต่างประเทศ

การต่อสู้เพื่อความหลากหลายทางภาษาใน AI – ปัญหาระดับโลก

March 23, 2025

105

ด้วยแว่นตา Geeky อันเป็นเอกลักษณ์ของเขาและชุดหูฟังสไตล์ Ted-talk, Sundar Pichai มองตรงจากศูนย์บ่มเพาะ Silicon Valley

วันจันทร์ที่ 10 กุมภาพันธ์หัวหน้าผู้บริหารของ Google ได้ขึ้นเวทีในการประชุมสุดยอด Motion Motion Motion ในปารีส จากแท่นของ Grand Palais เขาได้ประกาศยุคทองแห่งนวัตกรรมใหม่

“การใช้เทคนิค AI เราได้เพิ่มภาษาใหม่กว่า 110 ภาษาใน Google แปลเมื่อปีที่แล้วโดยพูดโดยผู้คนครึ่งพันล้านคนทั่วโลก” เจ้าพ่อเทคโนโลยีกล่าวดวงตาของเขาจับจ้องอยู่ที่บันทึกของเขา “นั่นทำให้เรามีทั้งหมด 249 ภาษารวมถึงภาษาแอฟริกา 60 ภาษา

ส่งมอบเป็นเสียงเดียวคำแถลงของเขาแทบจะไม่ได้ลงทะเบียนในหมู่ผู้เข้าร่วมประชุมสุดยอด – การชุมนุมของผู้นำโลกนักวิจัยองค์กรพัฒนาเอกชนและผู้บริหารด้านเทคโนโลยี

แต่สำหรับผู้สนับสนุนความหลากหลายทางภาษาศาสตร์ในปัญญาประดิษฐ์คำพูดของนายพิชัยเป็นชัยชนะที่เงียบสงบ-หนึ่งประสบความสำเร็จหลังจากสองปีของการเจรจาที่รุนแรงหลังการเจรจาในโลกอาร์เคนของการเจรจาต่อรองดิจิทัล

“ มันแสดงให้เห็นว่าข้อความกำลังผ่านและ บริษัท เทคโนโลยีกำลังรับฟัง” โจเซฟ Nkalwo Ngoula ที่ปรึกษานโยบายดิจิทัลที่ภารกิจสหประชาชาติขององค์การระหว่างประเทศของ La Francophonie ในนิวยอร์กกล่าว

การแบ่งแยกภาษาศาสตร์

คำปราศรัยของนายพิชัยเป็นหนทางไกลจากความผิดพลาดทางภาษาของ AI Generative Early Generative ซึ่งเป็นสาขาปัญญาประดิษฐ์ที่สามารถสร้างเนื้อหาต้นฉบับได้ตั้งแต่ข้อความไปจนถึงรูปภาพเพลงและแอนิเมชั่น

เมื่อ Openai เปิดตัว CHATGPT ในปี 2565 ลำโพงที่ไม่ใช่ภาษาอังกฤษค้นพบข้อ จำกัด อย่างรวดเร็ว

แบบสอบถามเป็นภาษาอังกฤษจะสร้างการตอบกลับอย่างละเอียดและให้ข้อมูล พรอมต์เดียวกันในภาษาฝรั่งเศส? สองย่อหน้าตามด้วยคำขอโทษที่น่ากลัว: “ขออภัยฉันไม่ได้รับการฝึกฝนเรื่องนั้น” หรือ “โมเดลของฉันไม่ได้รับการอัปเดตเกินวันนี้”

ช่องว่างดังกล่าวอยู่ในกลไกที่ซับซ้อนของเครื่องมือ AI ซึ่งขึ้นอยู่กับโมเดลภาษาขนาดใหญ่ (LLMs) เช่น GPT-4, Llama ของ Meta หรือ Gemini ของ Google เพื่อย่อยข้อมูลอินเทอร์เน็ตมากมายที่ช่วยให้พวกเขาเข้าใจและสร้างข้อความ

แต่อินเทอร์เน็ตเองก็เป็นแองโกลโฟนอย่างท่วมท้น ในขณะที่ประชากรเพียง 20 % ของโลกพูดภาษาอังกฤษที่บ้านเกือบครึ่งหนึ่งของข้อมูลการฝึกอบรมสำหรับรุ่น AI ที่สำคัญเป็นภาษาอังกฤษ

แม้กระทั่งทุกวันนี้การตอบสนองของ Chatgpt ในภาษาฝรั่งเศสโปรตุเกสหรือสเปนได้รับการปรับปรุง แต่ยังคงส่องสว่างน้อยกว่าคู่หูภาษาอังกฤษของพวกเขา

Digital Global Digital Compact มีวัตถุประสงค์เพื่อรวบรวมรัฐบาลและอุตสาหกรรมเพื่อให้แน่ใจว่าเทคโนโลยีเช่น AI ทำงานเพื่อมนุษยชาติทั้งหมด — รูปภาพของสหประชาชาติ/Elma Okic

โฟกัสที่คมชัดกว่า

“ ปริมาณของข้อมูลที่มีอยู่ในภาษาอังกฤษนั้นยิ่งใหญ่กว่ามาก แต่ก็มีความทันสมัยมากขึ้น” นาย Nkalwo Ngoula กล่าว โดยค่าเริ่มต้นโมเดล AI จะถูกฝึกอบรมและนำไปใช้เป็นภาษาอังกฤษทำให้ภาษาอื่น ๆ ที่ดิ้นรนเพื่อติดตาม

การหารไม่ใช่แค่เชิงปริมาณ AI เมื่อขาดการฝึกอบรมที่มีประสิทธิภาพในภาษาใดก็ตามเริ่ม “หลอน” – สร้างคำตอบที่ไม่ถูกต้องหรือไร้สาระด้วยอำนาจที่ไม่มั่นคง – เหมือนกับเพื่อนที่เกินความจริงท่วมท้นทางของเขาผ่านคืนเล็กน้อย

ภาพหลอน AI แบบคลาสสิกประกอบด้วยการตอบสนองต่อการร้องขอรายละเอียดชีวประวัติเกี่ยวกับบุคคลที่มีชื่อเสียงโดยการประดิษฐ์รางวัลโนเบลหรือมาพร้อมกับอาชีพคู่ขนานที่แปลกประหลาดดังเช่นในตัวอย่างนี้ที่สร้างโดย Chatgpt ตามคำสั่งของ ข่าวของสหประชาชาติ–

ข่าวไม่ได้: ‘วิกเตอร์ฮูโก้คือใคร?’

AI ภาพหลอน: “Victor Hugo นักเขียนชาวฝรั่งเศสในศตวรรษที่ 19 ก็เป็นนักบินอวกาศที่หลงใหลซึ่งมีส่วนร่วมในการออกแบบสถานีอวกาศนานาชาติในช่วงต้น”

กล่องดำ

“ มันเป็นกล่องดำที่ดูดซับข้อมูล” นาย Nkalwo Ngoula อธิบาย “ผลลัพธ์อาจสอดคล้องกันอย่างเป็นทางการและมีโครงสร้างอย่างมีเหตุผล แต่ตามจริงแล้วพวกเขาอาจไม่ถูกต้องอย่างดุเดือด”

นอกเหนือจากข้อผิดพลาดจริง AI มีแนวโน้มที่จะแบนความร่ำรวยทางภาษา Chatbots ต่อสู้กับสำเนียงระดับภูมิภาคและรูปแบบภาษาเช่นภาษา Quebecois ภาษาฝรั่งเศสหรือภาษาครีโอลที่พูดในเฮติและฝรั่งเศสแคริบเบียน

ภาษาฝรั่งเศสที่สร้างขึ้นโดย Ai มักจะรู้สึกว่าถูกสุขลักษณะถูกถอดออกจากความแตกต่างของโวหาร

“Molière, LéopoldSédar Senghor, AiméCésaire, Mongo Beti – พวกเขาทุกคนจะเปลี่ยนหลุมศพของพวกเขาถ้าพวกเขาเห็นว่า AI เขียนภาษาฝรั่งเศสในวันนี้อย่างไร” Mr. Nkalwo Ngoula พูดติดตลก

ปัญหานี้ดำเนินไปอย่างลึกซึ้งยิ่งขึ้นในประเทศที่พูดได้หลายภาษาเช่นเดียวกับในแคเมอรูนของนักการทูตซึ่งเยาวชนมักพูด Camfranglais ซึ่งเป็นลูกผสมของภาษาฝรั่งเศสอังกฤษพิดจิ้นและภาษาท้องถิ่น

“ ฉันสงสัยว่าคนหนุ่มสาวสามารถถาม AI บางอย่างใน Camfranglais และได้รับการตอบสนองที่มีความหมาย” เขากล่าว การแสดงออกเช่น “Je Yamo Ce Pays” (ฉันรักประเทศนี้) หรือ “Réponds-Moi Sharp-Sharp” (ตอบฉันอย่างรวดเร็ว) น่าจะทำให้โมเดล AI สับสน

Philemon Yang (ที่ Podium และบนหน้าจอ) ประธานการประชุมสมัชชาแห่งสหประชาชาติเจ็ดสิบเก้าครั้งกล่าวถึงการเปิดการประชุมสุดยอดแห่งอนาคตในวันที่ 22 กันยายน 2567 — รูปภาพของสหประชาชาติ/Loey Felipe

แคมเปญเงาของ La Francophonie

La Francophonie องค์กรของ Mr. Nkalwo Ngoula ซึ่งรวบรวม 93 รัฐและรัฐบาลเกี่ยวกับการใช้ภาษาฝรั่งเศสซึ่งเป็นตัวแทนของผู้คนมากกว่า 320 ล้านคนทั่วโลกได้ทำให้ช่องว่างทางภาษาศาสตร์นี้เป็นหัวใจสำคัญของกลยุทธ์ดิจิทัล

ความพยายามของกลุ่มได้สิ้นสุดลงใน UN International Digital Compact เมื่อปีที่แล้วซึ่งเป็นกรอบสำหรับการกำกับดูแล AI ที่ประเทศสมาชิกนำมาใช้ จากปี 2023 เป็นต้นไป La Francophonie ใช้ประโยชน์จากเครือข่ายการทูตของตน – รวมถึงกลุ่ม Ambassadors ของ Francophone ที่มีอิทธิพลในสหประชาชาติ – เพื่อให้แน่ใจว่าความหลากหลายทางภาษากลายเป็นหลักการสำคัญในการกำหนดนโยบาย AI

พันธมิตรที่ไม่คาดคิดเกิดขึ้น Lusophone และกลุ่มผู้สนับสนุนฮิสแปนิกเข้าร่วมการต่อสู้และแม้แต่วอชิงตันก็เข้าข้างสาเหตุของพวกเขา “การรวมภาษาสหรัฐฯได้รับการปกป้องในการพัฒนา AI” Mr. Nkalwo Ngoula กล่าว

การผลักดันของพวกเขาจ่ายออกไป ดิจิตอลระดับโลกขั้นสุดท้ายที่มีขนาดกะทัดรัดอย่างชัดเจนตระหนักถึงความหลากหลายทางวัฒนธรรมและภาษาศาสตร์ซึ่งเป็นปัญหาที่ถูกฝังอยู่ภายใต้การอภิปรายที่กว้างขึ้นเกี่ยวกับการเข้าถึง “ เป้าหมายของเราคือการนำมันไปสู่ระดับแนวหน้า” เขากล่าว

การเคลื่อนไหวยังมาถึง Silicon Valley ที่สหประชาชาติ การประชุมสุดยอดสำหรับอนาคต ในเดือนกันยายน 2567 ที่มีการใช้อย่างเป็นทางการอย่างเป็นทางการ Sundar Pichai ซีอีโอของ Google ทำให้หลายคนประหลาดใจโดยเน้นความจำเป็นสำหรับ AI เพื่อให้การเข้าถึงความรู้ระดับโลกในหลายภาษา

“ เรากำลังทำงานกับ 1,000 ภาษาที่พูดมากที่สุดในโลก” เขาให้คำมั่นว่าเขาจะยืนยันความมุ่งมั่นในเดือนปารีสต่อมา

ข้อ จำกัด ของ Digital International Digital Compact

แม้จะได้รับประโยชน์เหล่านี้ความท้าทายยังคงอยู่ หัวหน้าในหมู่พวกเขาคือการมองเห็น “เนื้อหาของ Francophone มักถูกฝังโดยอัลกอริทึมแพลตฟอร์ม” Mr Nkalwo Ngoula เตือน

สตรีมมิ่งยักษ์ใหญ่เช่น Netflix, YouTube และ Spotify จัดลำดับความสำคัญความนิยมซึ่งหมายถึงเนื้อหาภาษาอังกฤษครอบงำผลการค้นหา

“ หากความหลากหลายทางภาษาได้รับการพิจารณาอย่างแท้จริงผู้ใช้ที่พูดภาษาฝรั่งเศสควรเห็นภาพยนตร์ภาษาฝรั่งเศสที่อยู่ด้านบนของคำแนะนำของพวกเขา” เขากล่าว

การครอบงำของภาษาอังกฤษในข้อมูลการฝึกอบรม AI นั้นเป็นสิ่งกีดขวางที่ถูกขัดขวางโดยกะทัดรัดซึ่งไม่ได้อ้างอิงใด ๆ ยูเนสโกอนุสัญญาว่าด้วยความหลากหลายทางวัฒนธรรม – การกำกับดูแลที่นาย Nkalwo Ngoula ควรได้รับการแก้ไข

“ความหลากหลายทางภาษาต้องเป็นกระดูกสันหลังของการสนับสนุนดิจิทัลสำหรับ La Francophonie” Nkalwo Ngoula ยืนยัน

ด้วยการพัฒนา AI การเปลี่ยนแปลงเหล่านั้นไม่สามารถเกิดขึ้นได้เร็วเกินไป

(tagstotranslate) ข่าวสหประชาชาติ (T) วัฒนธรรมและการศึกษา

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

การต่อสู้เพื่อความหลากหลายทางภาษาใน AI – ปัญหาระดับโลก

การแบ่งแยกภาษาศาสตร์

โฟกัสที่คมชัดกว่า

กล่องดำ

แคมเปญเงาของ La Francophonie

ข้อ จำกัด ของ Digital International Digital Compact

LEAVE A REPLY Cancel reply

Popular Posts

9 Greatest Google Enterprise Profile Administration Instruments of 2025

We Examined Question Fan-Out Optimization (Right here‘s What We Realized)

Core Variations & Find out how to Win Visibility in Each

Popular category