โมเดล AI จาก OpenAI จะจดจำคำพูดโดยอัตโนมัติและแปลเป็นภาษาอังกฤษ

รูปคลื่นสีชมพูบนพื้นหลังสีน้ำเงิน สื่อถึงเสียงที่บ่งบอกถึงบทกวี

ขยาย (เครดิต: Benj Edwards / Ars Technica)

เมื่อวันพุธ OpenAI ได้เปิดตัวโมเดล AI แบบโอเพนซอร์สใหม่ที่เรียกว่า Whisper ซึ่งจดจำและแปลเสียงในระดับที่เข้าใกล้ความสามารถในการรับรู้ของมนุษย์ สามารถถอดความบทสัมภาษณ์ พอดแคสต์ บทสนทนา และอื่นๆ ได้

OpenAI ฝึก Whisper เกี่ยวกับข้อมูลเสียง 680,000 ชั่วโมงและการถอดเสียงที่ตรงกันในประมาณ 10 ภาษาที่รวบรวมจากเว็บ ตาม OpenAI วิธีการรวบรวมแบบเปิดนี้ได้นำไปสู่ ​​”การปรับปรุงความทนทานต่อสำเนียง เสียงพื้นหลัง และภาษาทางเทคนิค” นอกจากนี้ยังสามารถตรวจจับภาษาพูดและแปลเป็นภาษาอังกฤษได้

OpenAI อธิบาย Whisper ว่าเป็น หม้อแปลงเข้ารหัส-ถอดรหัส ซึ่งเป็นเครือข่ายประสาทชนิดหนึ่งที่สามารถใช้บริบทที่รวบรวมจากข้อมูลที่ป้อนเข้าเพื่อเรียนรู้การเชื่อมโยงที่สามารถแปลเป็นเอาต์พุตของโมเดลได้ OpenAI นำเสนอภาพรวมของการดำเนินการของ Whisper:

อ่าน 4 ย่อหน้าที่เหลือ | ความคิดเห็น

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น