AI รุ่นล่าสุดของ Openai มีการปกป้องใหม่เพื่อป้องกัน Biorisks -

Openai กล่าวว่ามันปรับใช้ระบบใหม่เพื่อตรวจสอบรูปแบบการให้เหตุผล AI ล่าสุด O3 และ O4-miniสำหรับการแจ้งเตือนที่เกี่ยวข้องกับภัยคุกคามทางชีวภาพและสารเคมี ระบบมีจุดมุ่งหมายเพื่อป้องกันไม่ให้โมเดลให้คำแนะนำที่สามารถสอนให้ใครบางคนดำเนินการโจมตีที่อาจเป็นอันตรายได้ ตามรายงานความปลอดภัยของ Openai–

O3 และ O4-Mini แสดงถึงความสามารถที่มีความหมายเพิ่มขึ้นมากกว่ารุ่นก่อนหน้าของ OpenAI บริษัท กล่าวและทำให้เกิดความเสี่ยงใหม่ในมือของนักแสดงที่ไม่ดี ตามเกณฑ์มาตรฐานภายในของ Openai O3 มีทักษะมากกว่าในการตอบคำถามเกี่ยวกับการสร้างภัยคุกคามทางชีวภาพบางประเภทโดยเฉพาะ ด้วยเหตุผลนี้-และเพื่อลดความเสี่ยงอื่น ๆ-OpenAI ได้สร้างระบบการตรวจสอบใหม่ซึ่ง บริษัท อธิบายว่าเป็น “การตรวจสอบการใช้เหตุผลที่เน้นความปลอดภัย”

จอภาพซึ่งได้รับการฝึกฝนให้กับเหตุผลเกี่ยวกับนโยบายเนื้อหาของ OpenAi ทำงานบน O3 และ O4-MINI มันถูกออกแบบมาเพื่อระบุการแจ้งเตือนที่เกี่ยวข้องกับความเสี่ยงทางชีวภาพและทางเคมีและสั่งให้แบบจำลองปฏิเสธที่จะให้คำแนะนำเกี่ยวกับหัวข้อเหล่านั้น

ในการสร้างพื้นฐาน OpenAi มีทีมงานสีแดงใช้เวลาประมาณ 1,000 ชั่วโมงตั้งค่าสถานะการสนทนาที่เกี่ยวข้องกับ Biorisk จาก O3 และ O4-MINI ในระหว่างการทดสอบที่ OpenAI จำลอง“ ตรรกะการบล็อก” ของจอภาพความปลอดภัยโมเดลปฏิเสธที่จะตอบสนองต่อความเสี่ยงที่เกิดขึ้นได้ 98.7% ของเวลาตาม OpenAI

Openai ยอมรับว่าการทดสอบไม่ได้อธิบายถึงผู้ที่อาจลองพรอมต์ใหม่หลังจากถูกบล็อกโดยจอภาพซึ่งเป็นสาเหตุที่ บริษัท บอกว่าจะยังคงพึ่งพาส่วนหนึ่งของการตรวจสอบของมนุษย์

O3 และ O4-mini ไม่ข้ามเกณฑ์“ ความเสี่ยงสูง” ของ Openai สำหรับ Biorisks ตาม บริษัท อย่างไรก็ตามเมื่อเทียบกับ O1 และ GPT-4, Openai กล่าวว่ารุ่นแรกของ O3 และ O4-Mini ได้รับการพิสูจน์แล้วว่ามีประโยชน์มากขึ้นในการตอบคำถามเกี่ยวกับการพัฒนาอาวุธชีวภาพ

แผนภูมิจากการ์ดระบบของ O3 และ O4-Mini (ภาพหน้าจอ: OpenAI)

บริษัท กำลังติดตามว่าแบบจำลองของมันสามารถทำให้ผู้ใช้ที่เป็นอันตรายได้ง่ายขึ้นในการพัฒนาภัยคุกคามทางเคมีและชีวภาพ กรอบการเตรียมความพร้อม–

OpenAI กำลังพึ่งพาระบบอัตโนมัติมากขึ้นเพื่อลดความเสี่ยงจากโมเดล ตัวอย่างเช่นเพื่อป้องกัน เครื่องกำเนิดภาพพื้นเมืองของ GPT-4O จากการสร้างวัสดุการล่วงละเมิดทางเพศเด็ก (CSAM)OpenAI กล่าวว่าใช้การตรวจสอบการใช้เหตุผลคล้ายกับ บริษัท ที่ใช้สำหรับ O3 และ O4-MINI

แต่นักวิจัยหลายคนได้หยิบยกข้อกังวลของ OpenAI ไม่ได้จัดลำดับความสำคัญความปลอดภัยเท่าที่ควร Metr หนึ่งในหุ้นส่วนของ บริษัท สีแดงของ บริษัท กล่าวว่ามีเวลาค่อนข้างน้อยในการทดสอบ O3 บนมาตรฐานสำหรับพฤติกรรมการหลอกลวง ในขณะเดียวกัน Openai ตัดสินใจที่จะไม่ปล่อยก รายงานความปลอดภัยสำหรับรุ่น GPT-4.1ซึ่งเปิดตัวเมื่อต้นสัปดาห์นี้

(tagstotranslate) AI Security (T) Chatgpt

Tags
openai

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

AI รุ่นล่าสุดของ Openai มีการปกป้องใหม่เพื่อป้องกัน Biorisks

Related articles

การรั่วไหลชี้ให้เห็นว่าลำโพงอัจฉริยะลึกลับของ Google อาจเปิดตัวในสี่สี

Adobe Acrobat Studio นำ Genai Energy มาสู่ PDFS – Computerworld

Greatest Google Pixel 10 Professional Fold Case 2025

LEAVE A REPLY Cancel reply

Latest posts

เพิ่มรายได้ในเครือ Amazon ของคุณด้วย Pinterest

10 อันดับประเทศที่ถูกที่สุดที่จะย้ายไปอยู่ในปี 2568 (ด้วยการเปรียบเทียบต้นทุน)

การรั่วไหลชี้ให้เห็นว่าลำโพงอัจฉริยะลึกลับของ Google อาจเปิดตัวในสี่สี

แชมป์การแข่งขัน James Webb ในสารคดีใหม่ของเขา

ความอดอยากในฉนวนกาซา: ‘ความล้มเหลวของมนุษยชาติ’

วิธีที่ดีที่สุดในการทำให้ชิ้นส่วนโปรดของคุณดูใหม่

Popular Posts

เพิ่มรายได้ในเครือ Amazon ของคุณด้วย Pinterest

10 อันดับประเทศที่ถูกที่สุดที่จะย้ายไปอยู่ในปี 2568 (ด้วยการเปรียบเทียบต้นทุน)

การรั่วไหลชี้ให้เห็นว่าลำโพงอัจฉริยะลึกลับของ Google อาจเปิดตัวในสี่สี

Popular category

AI รุ่นล่าสุดของ Openai มีการปกป้องใหม่เพื่อป้องกัน Biorisks

Related articles

LEAVE A REPLY Cancel reply

Stay Connected

Latest posts

Popular Posts

Popular category