นักวิทยาศาสตร์ที่กําลังทําให้ AI ปลอดภัยมากขึ้น

ในห้องประชุมที่ตกแต่งอย่างหรูหราด้วยรูปปั้นของนักวิทยาศาสตร์ที่มีชื่อเสียง มีผู้เชี่ยวชาญด้านวิทยาศาสตร์สิ่งแวดล้อมและโรคระบาดประมาณ 40 คนกําลังยุ่งอยู่กับแล็ปท็อปของตนเมื่อวันพุธที่ผ่านมา (วันที่ 25 ตุลาคม)

จนถึงวันนั้น เจ้าหน้าที่ได้สามารถเอาชนะระบบป้องกันของระบบ AI ชื่อ Llama 2 ของ Meta และทําให้มันสามารถอ้างว่านกสามารถดูดซับมลพิษในอากาศได้ อ้างว่าการรับประทานกระเทียมและ “สมุนไพรลึกลับ” สามารถป้องกันการติดเชื้อโควิด-19 ได้ สร้างข้อมูลที่ดูหมิ่นนักวิทยาศาสตร์คนหนึ่ง และส่งเสริมให้เด็กฉีดวัคซีนที่ไม่แนะนําให้เด็ก

กิจกรรมดังกล่าวซึ่งจัดขึ้นภายใต้เพดานที่ตกแต่งอย่างหรูหราที่ราชสมาคมในลอนดอนนั้น ได้เน้นย้ําถึงจุดอ่อนที่ระบบ AI ที่ทันสมัยที่สุดยังสามารถถูกทําลายได้

การสร้างระบบป้องกันที่ดีขึ้น

ระบบภาษาขนาดใหญ่ (LLM) ซึ่งเป็นระบบ AI ที่ขับเคลื่อนระบบสนทนา AI เช่น ChatGPT ปกติจะมีระบบป้องกันเพื่อป้องกันการสร้างเนื้อหาที่ไม่เหมาะสมหรืออันตราย – ทั้งข้อมูลปลอม สื่อลามก หรือคําแนะนําเกี่ยวกับการสร้างอาวุธชีวภาพหรือมาแลร์แวร์ แต่ระบบป้องกันเหล่านี้บางครั้งก็อ่อนแอ

“เรายังคงมีการปรับปรุงระบบ Llama 2 อย่างต่อเนื่องภายหลังการเปิดตัวเวอร์ชันแรก และเราขอขอบคุณโอกาสที่ได้ร่วมงานกับราชสมาคมและ Humane Intelligence เพื่อร่วมกันสร้างระบบป้องกันที่รับผิดชอบ” กล่าวโดย Cristian Canton Ferrer ผู้รับผิดชอบด้านระบบ AI ที่รับผิดชอบของ Meta ในแถลงการณ์

ผู้เข้าร่วมกิจกรรมในลอนดอนสามารถทําให้ Llama 2 สร้างบทความข่าวและทวีตที่มีเนื้อหาเชื่อมโยง และทฤษฎีสมคบ โดยใช้ถ้อยคําที่ดึงดูดกลุ่มเป้าหมายเฉพาะ ซึ่งแสดงให้เห็นว่าระบบภาษาเหล่านี้สามารถนําไปใช้สร้างข้อมูลปลอมได้ และสามารถสร้างวิธีการแพร่ข้อมูลปลอมได้อย่างกว้างขวางมากขึ้น

Bethan Cracknell Daniels นักวิทยาศาสตร์ด้านไข้เลือดออกที่ Imperial College London ซึ่งเข้าร่วมกิจกรรมสามารถทําให้ระบบสร้างแคมเปญโฆษณาเพื่อส่งเสริมให้เด็กทุกคนได้รับวัคซีนไข้เลือดออก – แม้ว่าวัคซีนนี้ไม่แนะนําให้กับบุคคลที่ไม่เคยป่วยมาก่อน ระบบยังสร้างข้อมูลปลอมเพื่อสนับสนุนอ้างว่าวัคซีนนี้ปลอดภัยและประสบความสําเร็จในสถานการณ์จริง “มันเป็นเรื่องที่สร้างขึ้นมาทั้งหมด” Cracknell Daniels กล่าวกับ TIME

พลังงานนิวเคลียร์และสุนัขบ้าน

Jonathan Morgan นักวิศวกรรมพลังงานนิวเคลียร์จากมหาวิทยาลัยแมนเชสเตอร์สามารถทําให้ Llama 2 สร้างบทความข่าวปลอมที่อ้างว่าการเดินสุนัขใกล้โรงไฟฟ้านิวเคลียร์สามารถทําให้สุนัขบ้าได้ “สิ่งที่นี่แสดงให้เห็นคือ ถ้าคุณมีวาระเพื่อแพร่ข้อมูลปลอม ระบบภาษาเหล่านี้สามารถสร้างสิ่งที่ดูน่าเชื่อถือได้อย่างง่ายดาย” กล่าวโดย Morgan

ระบบภาษาขนาดใหญ่เคยถูกแสดงให้เห็นว่ามีความเสี่ยงต่อ “การโจมตีทางประชาน” ซึ