ผู้อ่านเบต้านั้นยอดเยี่ยม

ย้อนกลับไปในเดือนมกราคม ฉันได้โพสต์ข้อความ เชิญชวนให้ “ผู้อ่านรุ่นเบต้า” : คนที่อ่านข้อความร่างแรกๆ ของโพสต์ของฉันและให้ข้อเสนอแนะอย่างตรงไปตรงมา

ผู้อ่านรุ่นเบต้าที่ฉันเลือกด้วยวิธีนี้เป็นหนึ่งในสิ่งที่ฉันโปรดปรานเกี่ยวกับการเริ่ม Cold Takes

โดยพื้นฐานแล้ว เป้าหมายอย่างหนึ่งของฉันกับ Cold Takes คือการอธิบายมุมมองที่แปลกประหลาดที่สุดของฉันให้ชัดเจน แต่มันยากที่จะเขียนให้ชัดเจนโดยไม่มีข้อเสนอแนะโดยละเอียดเกี่ยวกับจุดที่ฉันเข้าใจและไม่ชอบ ฉันมีอคติและข้อสันนิษฐานมากมายที่ฉันไม่ได้สังเกตโดยธรรมชาติ และการเขียนบล็อกเพียงอย่างเดียวไม่ได้ผลตอบรับนั้นเพราะ:

  • คนส่วนใหญ่ไม่ต้องการ อธิบายว่าพวกเขาได้รับประสบการณ์อย่างไร – หากพวกเขาไม่สนุกกับมัน พวกเขาแค่ต้องการคลิกออกไป
  • และคนที่ ต้องการ ช่วยฉัน (เช่น เพื่อนและเพื่อนร่วมงาน) ไม่จำเป็นต้องซื่อสัตย์เพียงพอ หรือเป็นตัวแทนของกลุ่มเป้าหมายของฉันมากพอ (ซึ่งโดยพื้นฐานแล้ว “ผู้ที่สนใจหัวข้อของฉันแต่ไม่ มีภูมิหลังมากมายอยู่แล้ว”)

ฉันได้ลองหลายสิ่งหลายอย่างเพื่อค้นหาโปรแกรมอ่านเบต้าที่ดี ตั้งแต่การสรรหาเพื่อนของเพื่อน (ทำงานได้ดีอยู่บ้าง แต่ฉันเขียนโพสต์จำนวนมากและยากที่จะได้รับการมีส่วนร่วมอย่างยั่งยืน) ไปจนถึงการจ่ายเงินให้ พนักงานเครื่องกลของเติร์ก ให้ข้อเสนอแนะ (บางอย่างก็ดี แต่โดยทั่วไปแล้วพวกเขาไม่สนใจหัวข้อแปลก ๆ ของฉันและรีบอ่านและแสดงความคิดเห็นโดยเร็วที่สุด)

ผู้คนที่เข้ามาโดยผ่านสายการสรรหาในเดือนมกราคมเป็นสิ่งที่ฉันต้องการ: พวกเขาสนใจในหัวข้อของ Cold Takes แต่พวกเขาไม่รู้จักฉันและความคิดของฉันเกี่ยวกับพวกเขาแล้วและพวกเขาให้รายละเอียดที่น่าประทับใจและรอบคอบ คำติชมเกี่ยวกับปฏิกิริยาของพวกเขาเป็นชิ้น ๆ – มักจะเป็นการผสมผสานที่ยอดเยี่ยมของ “อัจฉริยะ” และ “สุจริตว่าหลายสิ่งที่ฉันพูดทำให้สับสน” การได้รับคำติชมแบบนั้นถือเป็นสิทธิพิเศษ

ดังนั้น: ขอขอบคุณผู้อ่านเบต้าต่อไปนี้ แต่ละคนได้ส่งบทวิจารณ์ที่รอบคอบอย่างน้อย 3 รายการ (และอนุญาตให้แสดงที่นี่):

Lars Axelsson

เจเรมี แคมป์เบล

กานาด จักรพรรษา

Craig Chatterton

Justin Dickerson

อีธาน เอ็ดเวิร์ดส์

เอ็ดเวิร์ด กาทูรู

Stian Grønlund

Bridget Hanna

Tyler Heishman

อดัม เจอร์มิน

เอลเลียต โจนส์

เอ็ด วิลเลียม

Scott Leibrand

Evan R. Murphy

จอห์น โอนีล

เจมี่ เซบีย่า

Josh Simpson

โจชัว เทมเปิลตัน

จอร์จ โธมา

Martin Trouilloud

Morgan Wack

เควิน วิเทเกอร์

Arjun Yadav

แพทริค ยัง

หากคุณต้องการสมัครเป็นโปรแกรมอ่านเบต้า คุณสามารถใช้ แบบฟอร์ม นี้ ฉันมีงานร่างจำนวนมากที่กำลังจะเปิดตัวใน AI ขณะที่ฉันกำลังสร้างภาคต่อของ ซีรีส์ศตวรรษที่สำคัญที่สุด (ชื่ออย่างเป็นทางการคือ “ศตวรรษที่สำคัญที่สุด II: แล้วเราจะทำอย่างไร?”)

บันทึกการติดตามของนักอนาคตดูเหมือน … สบายดี

บันทึกการติดตามของนักอนาคตดูเหมือน ... สบายดี

คลิกขวาล่างเพื่อดาวน์โหลดหรือค้นหาใน Apple Podcasts, Spotify, Stitcher เป็นต้น

ฉันได้โต้แย้งว่าการพัฒนา AI ขั้นสูงสามารถทำให้ศตวรรษนี้กลายเป็น ศตวรรษที่สำคัญที่สุด สำหรับมนุษยชาติ ปฏิกิริยาทั่วไปต่อแนวคิด นี้ คือความเห็นโดย Tyler Cowen ว่า “นักคิดในอดีตสามารถทำนายอนาคตได้ดีเพียงใด อย่าเลือกเพียงแค่คนที่โด่งดังเพราะพวกเขามีสิ่งที่ยิ่งใหญ่ที่ถูกต้อง”

นี่เป็นเหตุผลทั่วไปที่ผู้คนมักสงสัยเกี่ยวกับ ศตวรรษที่สำคัญที่สุด และบ่อยครั้งสำหรับความกังขาเกี่ยวกับความพยายามใน ลัทธิอนาคต (พยายามทำนายเหตุการณ์สำคัญในโลกนี้เป็นเวลานาน) หรือการ บังคับทิศทาง โลกนำทางเหตุการณ์สำคัญในอนาคตดังกล่าว)

แนวความคิดนี้มีลักษณะดังนี้: “แม้ว่าเราจะไม่สามารถระบุจุดอ่อนเฉพาะใน การโต้แย้ง เกี่ยวกับเหตุการณ์สำคัญในอนาคตได้ บางทีเราควรสงสัยในความสามารถของเราเองที่จะพูดอะไรที่มีความหมายเกี่ยวกับอนาคตในระยะยาว ดังนั้นบางทีเรา ควรลืมเกี่ยวกับทฤษฎีแห่งอนาคต และมุ่งไปที่การลดความทุกข์ในปัจจุบัน โดยทั่วไปจะเพิ่มขีดความสามารถของมนุษย์ เป็นต้น”

แต่โดย ทั่วไป แล้วผู้คนมักคาดเดาเหตุการณ์ในอนาคตได้ไม่ดีหรือไม่? รวมถึงคนช่างคิดที่พยายามอย่างหนักพอสมควรที่จะเป็นฝ่ายถูก? หากเรามองย้อนกลับไปที่คำทำนายของนักอนาคตที่มีชื่อเสียง ประวัติที่แท้จริงเป็นอย่างไร สถานการณ์เลวร้ายแค่ไหน?

ฉันได้ดูค่อนข้างไกลและกว้างสำหรับคำตอบที่ เป็นระบบ สำหรับคำถามนี้และ 1 Luke Muehlhauser ของ Open Philanthropy ได้ใช้ความพยายามพอสมควรในการค้นคว้า ฉันพูดถึงสิ่งที่เราพบใน ภาคผนวก จนถึงตอนนี้ เรายังไม่พบมากทั้งหมด – ข้อสังเกตหลักคือ เป็นการยากที่จะตัดสินประวัติของนักอนาคตนิยม (ลุคพูดถึงความยากลำบาก ที่นี่ )

เมื่อเร็ว ๆ นี้ ฉันได้ทำงานร่วมกับ Gavin Leech และ Misha Yagudin ที่ Arb Research เพื่อแก้ไขปัญหานี้อีกครั้ง ฉันพยายามทำให้สิ่งต่าง ๆ ง่ายกว่าความพยายามในอดีต – เพื่อดูนักอนาคตในอนาคตสองสามคนที่ (a) ทำนายสิ่งต่าง ๆ “คล้าย” ความก้าวหน้าใน AI (แทนที่จะเช่นการทำนายแนวโน้มของประชากรโลก); (b) อาจคิดอย่างมีเหตุผลเกี่ยวกับเรื่องนี้ แต่ (c) ไม่ชัดเจนนัก “เลือกเฉพาะคนที่มีชื่อเสียงเพราะพวกเขามีสิ่งที่ถูกต้อง” ดังนั้นฉันจึงขอให้ Arb ดู คำทำนายของนักเขียนนิยายวิทยาศาสตร์ “บิ๊กทรี” ในช่วงกลางศตวรรษที่ 20 ได้แก่ Isaac Asimov, Arthur C. Clarke และ Robert Heinlein

คนเหล่านี้เป็นคนที่คิดมากเกี่ยวกับวิทยาศาสตร์และอนาคต และคาดการณ์มากมายเกี่ยวกับเทคโนโลยีในอนาคต แต่พวกเขามีชื่อเสียงในด้าน ความบันเทิงในนิยายของพวกเขาในเวลา นั้น ไม่ใช่ว่าการทำนายสารคดีของพวกเขาจะดูดีเพียงใดในการมองย้อนกลับไป ฉันเลือกพวกเขาโดยจำได้คร่าวๆ ว่า “สามยักษ์ใหญ่แห่งนิยายวิทยาศาสตร์” เป็นสิ่งที่ผู้คนพูดกันในบางครั้ง ใช้กูเกิลและไปกับใครที่มา – ไม่ต้องตามล่าหานักเขียนแนวไซไฟจำนวนมากและเลือกสิ่งที่ดีที่สุดหรือแย่ที่สุด 2

ดังนั้น ฉันคิดว่าประวัติการทำงานของพวกเขาควรให้ความรู้สึกที่ดีแก่เราสำหรับ “สิ่งที่คาดหวังจากผู้ที่ไม่ใช่มืออาชีพ ผู้เชี่ยวชาญ หรือนักพยากรณ์ที่โชคดีอย่างเห็นได้ชัด แต่กำลังพยายามใช้ความคิดอย่างมีเหตุผล” ตามที่ฉันจะอธิบาย ด้านล่าง ฉันคิดว่านี่เป็นวิธีที่ “ไม่ยุติธรรม” หลายวิธีเมื่อเปรียบเทียบกับการคาดการณ์ในปัจจุบันเกี่ยวกับ AI: ฉันคิดว่าการคาดการณ์เหล่านี้ไม่จริงจังมากนัก พิจารณาให้รอบคอบน้อยกว่า และเกี่ยวข้องกับงานน้อยลง (โดยเฉพาะงานที่ชั่งน้ำหนักผู้คนและข้อโต้แย้งที่แตกต่างกัน กันและกัน).

แต่สิ่งที่ฉันทำได้คือ บันทึกการติดตามของพวกเขาดู … ดี! พวกเขาทำการคาดการณ์ที่ละเอียดและไม่ชัดเจนเกี่ยวกับอนาคตระยะยาว (30+ มักจะ 50+ ปี); ผลลัพธ์มีตั้งแต่ “น่าประทับใจมาก” (อาซิมอฟมีสิทธิ์ประมาณครึ่งหนึ่งโดยคาดการณ์ที่ดูเหมือนไม่ชัดเจน) ถึง “แย่” (ไฮน์ไลน์เกือบ 35% และการโจมตีของเขาดูไม่ค่อยดี) ถึง “ที่ไหนสักแห่งในระหว่าง ” (คลาร์กมีอัตราการโจมตีที่ใกล้เคียงกับอาซิมอฟ แต่การคาดการณ์ที่ถูกต้องของเขาดูไม่น่าประทับใจเท่าไหร่) มีการคาดคะเนที่ดูน่าประทับใจและน่าอายมากมาย

(เราจะกำหนดระดับความแม่นยำได้อย่างไรว่า “ดี” กับ “แย่” โชคไม่ดีที่ไม่มีเกณฑ์เปรียบเทียบเชิงปริมาณที่ชัดเจน – ฉันคิดว่าเราแค่ต้องดูการคาดคะเนด้วยตัวเองว่ามันยากแค่ไหน / คล้ายกับคำทำนายของวันนี้อย่างไร AI และทำการตัดสิน ฉันสามารถจินตนาการได้อย่างง่ายดายว่าคนอื่นมีการตีความที่แตกต่างจากของฉัน นั่นคือเหตุผลที่ฉันยกตัวอย่างและเชื่อมโยงไปยังชุดการทำนายทั้งหมด ฉันพูดถึงสิ่งนี้เพิ่มเติม ด้านล่าง )

พวกเขาไม่ใช่นักพยากรณ์ที่ผิดพลาด แต่ก็ไม่ได้สุ่มสี่สุ่มห้าเกี่ยวกับเรื่องนี้ (บางทีไฮน์ไลน์อาจเป็น) โดยรวมแล้ว ฉันคิดว่าคุณสามารถเรียกพวกเขาว่า “ธรรมดา” แต่คุณไม่สามารถเรียกพวกเขาว่า “สิ้นหวัง” หรือ “ไร้เงื่อนงำ” หรือ “สัญญาณเตือนแก่ทุกคนที่กล้าทำนายอนาคตในระยะยาวไม่ได้ ” โดยรวมแล้ว ฉันคิดว่าพวกเขาทำอย่างนั้นและคุณอาจไร้เดียงสา 3 เดาว่าคนที่มีไหวพริบดีจะทำอะไรโดยบังเอิญที่พวกเขาพยายามทำ?

ด้านล่าง ฉันจะ:

  • สรุป ประวัติผลงานของอาซิมอฟ คลาร์ก และไฮน์ไลน์ พร้อมเชื่อมโยงไปยังรายงานฉบับสมบูรณ์ของ Arb
  • แสดงความคิดเห็น ว่าทำไมฉันถึงคิดว่า การคาดคะเนที่สำคัญเกี่ยวกับ AI ที่เปลี่ยนแปลง ได้น่าจะเป็นเดิมพันที่ดีกว่าการคาดการณ์ของ Asimov/Clarke/Heinlein แม้ว่าในท้ายที่สุดแล้ว หากเป็นเพียง “การเดิมพันที่ดีพอๆ กัน” ฉันคิดว่ามันเพียงพอแล้วที่จะสนับสนุนกรณีของฉันที่เราควรจะจ่าย ให้ความสนใจกับสมมติฐาน “ศตวรรษที่สำคัญที่สุด” มาก ขึ้น
  • สรุปงานวิจัยอื่นๆ ที่มีอยู่เกี่ยวกับประวัติของนักอนาคตนิยม ซึ่งฉันคิดว่าสอดคล้องกับแนวคิดนี้ในวงกว้าง (แต่ส่วนใหญ่คลุมเครือ)

สำหรับการตรวจสอบนี้ Arb ได้ขุดค้นแหล่งข้อมูลเก่าหลายๆ แหล่งอย่างรวดเร็ว (ในเวลาประมาณ 8 สัปดาห์) ใช้การจับคู่รูปแบบและความพยายามด้วยตนเองเพื่อค้นหาการคาดการณ์ และทำงานร่วมกับผู้รับเหมาเพื่อทำคะแนนจากการคาดการณ์หลายร้อยรายการที่พวกเขาพบ ขอบคุณมากสำหรับพวกเขา! รายงานฉบับเต็มของพวกเขาอยู่ ที่นี่ หมายเหตุเล็กน้อยนี้: “หากคุณพบเห็นบางอย่างผิดปกติ เราจะจ่ายเงิน $5 ต่อเซลล์ที่เราอัปเดตตามผลลัพธ์ เราจะเพิ่มคำวิจารณ์ทั้งหมดที่เราเห็นด้วยและอัปเดตหรือปฏิเสธในเอกสารนี้เพื่อความโปร่งใส”

ประวัติผลงาน “บิ๊กทรี”

สรุปอย่างรวดเร็วว่า Arb สร้างชุดข้อมูลอย่างไร

Arb รวบรวม “สำเนาดิจิทัลของสารคดี [ของอาซิมอฟ, คลาร์ก, ไฮน์ไลน์] ให้มากที่สุดเท่าที่จะเป็นไปได้ (หนังสือ เรียงความ บทสัมภาษณ์) ผลที่ได้คือ 475 ไฟล์ครอบคลุม ~ 33% ของศพที่ไม่ใช่นิยาย”

จากนั้น Arb ใช้การจับคู่รูปแบบและการตรวจสอบด้วยตนเองเพื่อดึงการคาดคะเนทั้งหมดที่หาพบ และทำคะแนนการคาดการณ์เหล่านี้โดย:

  • ปรากฏว่าคำทำนายนั้นอยู่ห่างออกไปกี่ปี (ส่วนใหญ่ไม่ได้แนบวันที่ที่ชัดเจน ในกรณีเหล่านี้ Arb มักจะเติมขอบฟ้าเวลาเฉลี่ยสำหรับการคาดการณ์จากผู้เขียน คน เดียวกันซึ่งมีวันที่ชัดเจนที่แนบมาด้วย)
  • ไม่ว่าการคาดคะเนจะปรากฏว่าถูกต้อง ไม่ถูกต้อง หรือคลุมเครือหรือไม่ (ฉันไม่ได้เห็นด้วยกับการให้คะแนนเหล่านี้เสมอไป แต่โดยทั่วไปแล้วฉันรู้สึกว่าการคาดคะเนที่ “ถูกต้อง” อย่างน้อยก็ดู “น่าประทับใจและไม่งี่เง่า” ในขณะที่การคาดการณ์ที่ “ไม่ถูกต้อง” อย่างน้อยก็ดู “เสี่ยง”)
  • การคาดคะเนเป็นการคาดการณ์ล้วนๆ เกี่ยวกับสิ่งที่เทคโนโลยีสามารถทำได้ (เกี่ยวข้องมากที่สุด) การคาดการณ์เกี่ยวกับปฏิสัมพันธ์ของเทคโนโลยีและเศรษฐกิจ (ปานกลาง) หรือการคาดการณ์เกี่ยวกับปฏิสัมพันธ์ของเทคโนโลยีและวัฒนธรรม (มีความเกี่ยวข้องน้อยที่สุด) การคาดการณ์ที่ไม่มีผลกระทบต่อเทคโนโลยีลดลง
  • การทำนาย “ยาก” เพียงใด (นั่นคือผู้ทำคะแนนเดาว่ามันแตกต่างจากภูมิปัญญาดั้งเดิมหรือ “สิ่งที่ชัดเจน” ในขณะนั้นมากเพียงใด – รายละเอียดในเชิงอรรถ 4 )

ที่สำคัญ นิยายไม่เคยถูกใช้เป็นแหล่งการทำนาย ดังนั้นแบบฝึกหัดนี้จึงให้คะแนนผู้คนอย่างชัดเจนถึงสิ่งที่พวกเขา ไม่ได้ มีชื่อเสียง นี่เป็นเหมือนการประเมินว่า “คนที่ชอบคิดเกี่ยวกับอนาคตทำการคาดการณ์ที่ดีหรือไม่” มากกว่าการประเมินว่า “นักพยากรณ์มืออาชีพหรือผู้เชี่ยวชาญคาดการณ์ได้ดีหรือไม่”

ด้วยเหตุผลที่ฉันกล่าวถึงใน ภาคผนวกด้านล่าง ฉันไม่ได้ขอให้ Arb พยายามระบุว่าบิ๊กทรีมีความมั่นใจเพียงใดเกี่ยวกับการคาดคะเนของพวกเขา ฉันสนใจว่าการคาดคะเนของพวกเขาไม่ชัดเจนหรือไม่ และบางครั้งก็ถูกต้อง มากกว่าว่าพวกเขา ตระหนักในตนเองเกี่ยวกับความไม่แน่นอนของตนเองหรือไม่ ฉันมองว่าสิ่งเหล่านี้เป็นประเด็นที่แตกต่างกัน และฉันสงสัยว่าบรรทัดฐานในอดีตทำให้สิ่งหลังท้อใจมากกว่าปกติในปัจจุบัน (อย่างน้อยก็ภายในชุมชนที่สนใจใน แนวความคิดแบบเบย์ และ ศาสตร์แห่งการพยากรณ์ )

รายละเอียดเพิ่มเติมใน รายงานของ Arb

ตัวเลข

ตารางด้านล่างสรุปตัวเลขที่ฉันคิดว่าให้ภาพระดับสูงที่ดีที่สุด ดู รายงานฉบับเต็ม และ ไฟล์รายละเอียด สำหรับการคาดคะเนดิบและการตัดอื่นๆ จำนวนหนึ่ง มีหลายวิธีที่คุณสามารถแบ่งข้อมูลได้ แต่ฉันไม่คิดว่ามันจะเปลี่ยนรูปภาพจากสิ่งที่ฉันให้ไว้ด้านล่าง

ด้านล่างนี้ ฉันนำเสนอประวัติของผู้ทำนายเกี่ยวกับ:

  • “การคาดคะเนทั้งหมด”: การคาดคะเนที่แก้ไขได้ทั้งหมด 30 ปีหรือมากกว่านั้น 5 รายการรวมถึงการคาดการณ์ที่ Arb ต้องกรอกในกรอบเวลา
  • “การคาดคะเนทางเทคนิค”: เช่นเดียวกับข้างต้น แต่จำกัดเฉพาะการคาดคะเนเกี่ยวกับความสามารถทางเทคโนโลยีโดยเฉพาะ (ตรงข้ามกับปฏิสัมพันธ์ทางเทคโนโลยี/เศรษฐกิจ หรือปฏิสัมพันธ์ทางเทคโนโลยี/วัฒนธรรม
  • การคาดการณ์ “ยาก” กับ “ความยาก” 4/5 หรือ 5/5
  • “ยาก + เทคโนโลยี + วันที่แน่นอน”: ชุดคำทำนายเล็กๆ ที่ตรงตามเกณฑ์ที่เข้มงวดที่สุด (เฉพาะเทคโนโลยี “ความแข็ง” 4/5 หรือ 5/5 แนบวันที่แน่นอน)

อาซิมอฟ

หมวดหมู่ # ถูกต้อง # ไม่ถูกต้อง #คลุมเครือ/ใกล้พลาด ถูกต้อง / (ถูก + ผิด)
ทั้งหมดได้รับการแก้ไข
คำทำนาย

23

29

14

44.23%

การคาดการณ์ทางเทคนิค

11

4

8

73.33%

การทำนายที่ยาก

10

11

7

47.62%

ยาก + เทคโนโลยี + วันที่แน่นอน

5

1

4

83.33%

คุณสามารถดูชุดการคาดคะเนทั้งหมดได้ ที่นี่ แต่เพื่อให้เห็นถึงรสชาติ นี่คือการคาดคะเนที่ “ถูกต้อง” สองรายการ และการคาดการณ์ที่ “ไม่ถูกต้อง” สองรายการจากหมวดหมู่ที่เข้มงวดที่สุด 6 ทั้งหมดนี้เป็นคำทำนายของอาซิมอฟในปี 2507 ประมาณปี 2557 (เว้นแต่จะระบุไว้เป็นอย่างอื่น)

  • ถูกต้อง: “มีเพียงเรือไร้คนขับเท่านั้นที่จะลงจอดบนดาวอังคาร แม้ว่าจะมีการสำรวจด้วยมนุษย์” บิงโกและ IMO ที่น่าประทับใจ
  • ถูกต้อง: “หน้าจอ [ของโทรศัพท์] ไม่เพียงใช้เพื่อดูคนที่คุณโทรหาเท่านั้น แต่ยังสามารถใช้เพื่อศึกษาเอกสารและรูปถ่ายและอ่านข้อความจากหนังสือ” ฉันรู้สึกว่านี่จะเป็นคำทำนายที่น่าประทับใจในปี 2547
  • ไม่ถูกต้อง: “จะมีการเน้นมากขึ้นในการขนส่งที่ทำให้มีการสัมผัสกับพื้นผิวน้อยที่สุด แน่นอนว่าจะมีเครื่องบิน แต่การเดินทางภาคพื้นดินก็จะพาขึ้นไปในอากาศหนึ่งหรือสองฟุตจากพื้นดินมากขึ้น” ผิดมากที่ตอนนี้เราอ้างถึงสิ่งที่ไม่ได้วางเมาส์ไว้เป็น “hoverboards”
  • ไม่ถูกต้อง: “ลูกบาศก์โปร่งใสจะทำให้รูปลักษณ์ของพวกเขาสามารถรับชมสามมิติได้ อันที่จริงนิทรรศการยอดนิยมชิ้นหนึ่งที่งาน World’s Fair 2014 จะเป็นทีวี 3 มิติที่สร้างขึ้นขนาดเท่าตัวจริงซึ่งการแสดงบัลเล่ต์จะ มองเห็นได้ ลูกบาศก์จะค่อยๆ หมุนดูจากทุกมุม” ดูเหมือนไม่ตลก แต่ดูเหมือนไม่ถูกต้อง แน่นอน ประเด็นข้างเคียงในที่นี้คือเขาหมายถึงงาน World’s Fair 2014 ซึ่ง ไม่เกิดขึ้น

ความท้าทายทั่วไปในการประเมินบันทึกการติดตามการคาดการณ์คือเราไม่รู้ว่าจะเปรียบเทียบประวัติของใครบางคนกับอะไร การคาดการณ์ของคุณถูกต้องประมาณครึ่งหนึ่ง “ดี” หรือไม่น่าประทับใจไปกว่าการเขียนสิ่งต่างๆ ที่อาจเกิดขึ้นและพลิกเหรียญในแต่ละข้อหรือไม่

ฉันคิดว่าสิ่งนี้มาจาก ความยากของการคาดคะเน ซึ่งยากต่อการประเมินอย่างเป็นระบบ สิ่งที่ดีเกี่ยวกับการศึกษานี้คือ มีการคาดการณ์เพียงพอที่จะได้ขนาดตัวอย่างที่เหมาะสม แต่สิ่งทั้งหมดมีเพียงพอที่คุณจะได้สัมผัสเชิงคุณภาพที่ดีสำหรับการคาดคะเนด้วยตัวมันเอง (นี่คือเหตุผลที่ฉันยกตัวอย่าง คุณสามารถดูการคาดคะเนทั้งหมดสำหรับบุคคลหนึ่ง ๆ ได้โดยคลิกที่ชื่อของพวกเขาเหนือตาราง) ในกรณีนี้ ฉันคิดว่าอาซิมอฟมีแนวโน้มที่จะทำนายที่ไม่ชัดเจนและมีรายละเอียด ซึ่งฉันคิดว่าน่าประทับใจ ได้รับ ~ ครึ่งหนึ่งถูกต้อง

คลาร์ก

หมวดหมู่ # ถูกต้อง # ไม่ถูกต้อง #คลุมเครือ/ใกล้พลาด ถูกต้อง / (ถูก + ผิด)
คำทำนายทั้งหมด

129

148

48

46.57%

การคาดการณ์ทางเทคนิค

85

82

29

50.90%

การทำนายที่ยาก

14

10

4

58.33%

ยาก + เทคโนโลยี + วันที่แน่นอน

6

5

2

54.55%

ตัวอย่าง (ดังข้างบน): 7

  • แก้ไขคำทำนายปี พ.ศ. 2507 เกี่ยวกับปี พ.ศ. 2543 ได้ถูกต้อง: “[ดาวเทียมสื่อสาร] จะทำให้โลกนี้เป็นโลกที่เราสามารถติดต่อกันได้ทันทีไม่ว่าเราจะอยู่ที่ใด ที่ซึ่งเราสามารถติดต่อเพื่อนของเราได้ทุกที่บนโลก ถึงแม้ว่าเราจะไม่ทราบความจริงของพวกเขา ตำแหน่งทางกายภาพ ในยุคนั้น อาจจะเพียงห้าสิบปีต่อจากนี้สำหรับ [บุคคล] ที่จะทำธุรกิจ [ของพวกเขา] จากตาฮิติหรือบาหลีเช่นเดียวกับ [พวกเขา] จากลอนดอน” (ฉันคิดว่า “ดำเนินธุรกิจ [ของพวกเขา]” หมายถึงการติดต่อทางธุรกิจมากกว่าการเรียกร้องแบบองค์รวมบางประเภทว่าไม่มีการสูญเสียประสิทธิภาพการทำงานจากการทำงานระยะไกล)
  • ถูกต้องตามคำทำนายในปี พ.ศ. 2493 ประมาณปี พ.ศ. 2543: “แท้จริงแล้ว อาจสันนิษฐานได้ค่อนข้างแน่นอนว่าการลาดตระเวนครั้งแรกของดาวเคราะห์จะเป็นการโคจรรอบจรวดซึ่งไม่ได้พยายามจะลงจอด เครื่องจักรไร้คนขับที่ใช้แล้วทิ้งอาจใช้การวัดระยะทางและโทรทัศน์อย่างประณีต” ดูเหมือนจะไม่ใช่คำทำนายที่เฉียบขาด การคาดคะเนที่ถูกต้องจำนวนมากของเขามีรสนิยมทั่วไปที่จะบอกว่าความคืบหน้าจะไม่น่าตื่นเต้น เกินไป และฉันพบว่าสิ่งเหล่านี้น่าประทับใจน้อยกว่าการคาดการณ์ที่ถูกต้องของ Asimov ส่วนใหญ่
  • การคาดการณ์ที่ไม่ถูกต้องในปี พ.ศ. 2503 เมื่อปี พ.ศ. 2553 “ใครๆ ก็นึกภาพออกว่าก่อนสิ้นศตวรรษนี้ โรงงานขนาดใหญ่ขนาดใหญ่ที่ใช้พลังงานราคาถูกจากเครื่องปฏิกรณ์นิวเคลียร์แสนสาหัสเพื่อสกัดน้ำบริสุทธิ์ เกลือ แมกนีเซียม โบรมีน สตรอนเทียม รูบิเดียม ทองแดง และโลหะอื่นๆ อีกมาก จากทะเล ข้อยกเว้นที่โดดเด่นจากรายการคือ เหล็ก ซึ่งหาได้ยากในมหาสมุทรมากกว่าในทวีปต่างๆ “
  • การทำนายปี 1949 ที่ไม่ถูกต้องเกี่ยวกับปี 1983: “ก่อนที่เรื่องนี้จะโตเป็นสองเท่าของอายุปัจจุบัน เราจะมีนักสำรวจหุ่นยนต์กระจายอยู่ทั่วดาวอังคาร”

โดยทั่วไปแล้วฉันพบว่าชุดข้อมูลนี้น่าพึงพอใจ/เป็นการศึกษาน้อยกว่าของ Asimov: การคาดคะเนจำนวนมากนั้นค่อนข้างลึกซึ้งในวัชพืชว่าจรวดทำงานอย่างไรหรืออะไรทำนองนั้น และส่วนมากก็ค่อนข้างยากที่จะตีความ/ให้คะแนน ฉันคิดว่าการคาดคะเนที่แย่นั้นค่อนข้างแย่ และบางครั้งการคาดคะเนที่ดีนั้นก็ดี แต่โดยทั่วไปแล้วน่าประทับใจน้อยกว่าของอาซิมอฟ

ไฮน์ไลน์

หมวดหมู่ # ถูกต้อง # ไม่ถูกต้อง #คลุมเครือ/ใกล้พลาด ถูกต้อง / (ถูก + ผิด)
คำทำนายทั้งหมด

19

41

7

31.67%

การคาดการณ์ทางเทคนิค

14

20

6

41.18%

การทำนายที่ยาก

1

16

1

5.88%

ยาก + เทคโนโลยี + วันที่แน่นอน

0

1

1

0.00%

สิ่งนี้ดูแย่มาก โดยเฉพาะอย่างยิ่งเมื่อปรับตามความยาก: สิ่งที่ “ถูกต้อง” หลายๆ อย่างดูเหมือนจะตีความยากหรือชัดเจนมาก (เช่น ไม่ต้องเดินทางข้ามเวลา) ฉันรู้สึกประทับใจกับคำทำนายของเขาที่ว่า “เราอาจจะยังคงรักษาไข้หวัดธรรมดาอยู่” จนกระทั่งฉันเห็นคำทำนายในแหล่งที่แยกต่างหากว่า “มะเร็ง ไข้หวัด และฟันผุทั้งหมดจะถูกพิชิต” โดยรวมแล้ว ดูเหมือนว่าเขาได้ทำนายเรื่องแปลก ๆ มากมายเกี่ยวกับการเดินทางในอวกาศ และจากนั้นก็คาดเดาสิ่งที่ไม่น่าจะเป็นไปได้ (เช่น ไม่ต้องเดินทางข้ามเวลา)

เขามีสิ่งที่ดีบางอย่างเช่น: “ภายในปี 2000 AD เราจะรู้อย่างมากเกี่ยวกับการทำงานของสมอง … ในขณะที่ในปี 1900 เรารู้เพียงเล็กน้อยว่าผิด ฉันไม่ได้ทำนายว่าความลึกลับพื้นฐานของจิตวิทยา — การที่มวลที่จัดเรียงในรูปแบบที่ซับซ้อนบางอย่างจะรับรู้ได้อย่างไร — จะได้รับการแก้ไขภายในปี ค.ศ. 2000 ฉันหวังว่าจะเป็นอย่างนั้น แต่อย่าคาดหวังเลย” เขายังทำนายว่ามนุษย์จะไม่มีการสูญพันธุ์และไม่มีวันสิ้นสุดของสงคราม – ฉันเดาว่าคนจำนวนมากไม่เห็นด้วยกับสิ่งเหล่านี้ในขณะนั้น

ภาพรวม

ดูเหมือนว่าใน “บิ๊กทรี” เรามี:

  • หนึ่ง (อาซิมอฟ) ที่ดูค่อนข้างน่าประทับใจ – พลาดมากมาย แต่อัตราการโจมตี 50% จากการคาดคะเนที่ไม่ชัดเจนนั้นดูดีมาก
  • หนึ่ง (ไฮน์ไลน์) ที่ดูไม่จริงจังและไม่ถูกต้อง
  • คนหนึ่ง (คลาร์ก) ที่ตัดสินค่อนข้างยาก แต่โดยรวมแล้วดูค่อนข้างแข็งแกร่ง (ประมาณครึ่งหนึ่งของการคาดการณ์ของเขาดูเหมือนจะถูกต้อง

อนาคตของวันนี้กับการคาดการณ์เหล่านี้

ข้อมูลข้างต้นรวบรวมการคาดการณ์แบบไม่เป็นทางการ – ไม่มีการให้ความน่าจะเป็น การให้เหตุผลเพียงเล็กน้อยหรือไม่มีเลย ไม่มีความพยายามที่ชัดเจนในการรวบรวมหลักฐานและชั่งน้ำหนักข้อโต้แย้ง – โดยนักเขียนนิยายมืออาชีพ

เปรียบเทียบสถานการณ์นี้กับสรุป บรรทัดต่างๆ ของการคาดการณ์การให้เหตุผลเพื่อคาดการณ์ AI ที่ก่อให้เกิดการเปลี่ยนแปลง หลังรวมถึง:

มีพื้นที่มากมายสำหรับการอภิปรายว่าควรคาดหวังให้มาตรการเหล่านี้มากน้อยเพียงใดเพื่อปรับปรุงการมองการณ์ไกลของเรา เมื่อเทียบกับสิ่งที่ “บิ๊กทรี” ทำ ฉันเดาว่าเราควรจะ คาดการณ์เกี่ยวกับ AI ที่เปลี่ยนแปลง ได้อย่างจริงจังมากขึ้น ส่วนหนึ่งเป็นเพราะฉันคิดว่ามีความแตกต่างใหญ่ระหว่าง “ความพยายามเพียงเล็กน้อย” (โดยทั่วไปแล้วคาดเดานอกกรอบโดยไม่ต้องตรวจสอบข้อโต้แย้งและข้อโต้แย้งอย่างจริงจังซึ่งก็คือ ความประทับใจของฉันต่อสิ่งที่บิ๊กทรีส่วนใหญ่ทำ) และ “ใช้ความพยายามในระดับปานกลาง” (พิจารณาความคิดเห็นของผู้เชี่ยวชาญ การสำรวจข้อโต้แย้ง และข้อโต้แย้ง การคิดอย่างชัดเจนเกี่ยวกับระดับของความไม่แน่นอนของตนเอง)

แต่เวอร์ชัน “ใช้ความพยายามเพียงเล็กน้อย” ก็ไม่ได้ดูแย่ขนาดนั้น

หากคุณดูการคาดการณ์เกี่ยวกับ AI ที่เปลี่ยนแปลงและคิดว่า “บางทีนี่อาจเป็นการคาดคะเนของ Asimov-ish ที่มีอัตราการเข้าชมประมาณ 50% สำหรับคำถามที่ยาก บางทีนี่อาจเป็นการคาดคะเนของ Heinlein-ish ที่พื้นๆ ไร้สาระ” ซึ่งยังดูดีพอที่จะรับได้ สมมติฐาน ” ศตวรรษที่สำคัญที่สุด ” อย่างจริงจัง

ภาคผนวก: การศึกษาอื่น ๆ เกี่ยวกับประวัติของลัทธิอนาคตนิยม

โปรเจ็ก ต์ปี 2013 ประเมินการคาดการณ์ในปี 1999 ของ Ray Kurzweil เกี่ยวกับปี 2009 และการติดตามในปี 2020 ประเมิน การคาดการณ์ในปี 1999 ของเขาในปี 2019 Kurzweil ขึ้นชื่อว่ามีความ น่าสนใจในขณะนั้น มากกว่าที่จะ เข้าใจถึงปัญหาย้อนหลัง และมีการพบและให้คะแนนการคาดคะเนจำนวนมาก ดังนั้นฉันจึงถือว่าการศึกษานี้มีข้อได้เปรียบที่คล้ายคลึงกันกับการศึกษาข้างต้น

  • การคาดคะเนชุดแรก (ประมาณปี พ.ศ. 2552 ซึ่งเป็นช่วง 10 ปี) มีการคาดคะเนที่ “จริงหรือจริงเล็กน้อย” มากเท่ากับการคาดคะเน “เท็จหรือเท็จเพียงเล็กน้อย”
  • ครั้งที่สอง (ประมาณปี 2019 ซึ่งเป็นช่วง 20 ปี) เลวร้ายกว่ามาก โดย 52% ของการคาดการณ์เป็น “เท็จ” และ “เท็จหรือเท็จเล็กน้อย” อย่างตรงไปตรงมา ซึ่งมากกว่าการคาดการณ์ที่ “จริงหรือจริงเพียงเล็กน้อย” เกือบ 3 ต่อ 1

Kurzweil ขึ้นชื่อในเรื่องการคาดการณ์ที่กล้าหาญและขัดแย้งของเขา และโดยรวมแล้วฉันมีแนวโน้มที่จะเรียกประวัติของเขาว่า “ปานกลาง” และ “ดี” – โดยรวมแล้วก้าวร้าวเกินไป แต่มีเพลงฮิตที่โดดเด่นอยู่บ้าง (ฉันคิดว่าถ้าสมมติฐาน ที่สำคัญที่สุดของศตวรรษ กลายเป็นจริง เขาจะดูมีความเข้าใจในวงกว้างมาก แค่ช่วงแรกๆ หากไม่เป็นเช่นนั้น เขาจะดูไร้เหตุผลในวงกว้าง แต่นั่นคือ TBD)

กระดาษปี 2002 ซึ่งสรุปโดย Luke Muehlhauser ที่นี่ ได้ประเมินประวัติของ ปี 2000 โดย Herman Kahn และ Anthony Wiener “หนึ่งในผลิตภัณฑ์ที่มีชื่อเสียงและเป็นที่เคารพนับถือที่สุดของนักอนาคตนิยมมืออาชีพ”

  • ประมาณ 45% ของการคาดการณ์ได้รับการตัดสินว่าแม่นยำ
  • ลุคสรุปว่าคาห์นและวีเนอร์มั่นใจมากเกินไป เพราะเขาตีความว่าพวกเขาเป็นการทำนายด้วยความมั่นใจ 90-95%
  • Takeaway ของฉันแตกต่างกันเล็กน้อย ฉันเห็นหัวข้อที่เกิดซ้ำซึ่งผู้คนมักจะได้รับอัตราการเข้าชม 40-50% จากการคาดการณ์ที่น่าสนใจเกี่ยวกับอนาคต แต่บางครั้งนำเสนอการคาดคะเนเหล่านี้ด้วยความมั่นใจอย่างยิ่ง (ซึ่งทำให้ดูโง่)
  • ฉันคิดว่าเราสามารถแยก “ผู้พยากรณ์ในอดีตมั่นใจมากเกินไป” (ซึ่งฉันสงสัยว่าส่วนหนึ่งเป็นเพราะการ แสดงออกที่ชัดเจนและการหาปริมาณของความไม่แน่นอน เป็นเรื่องผิดปกติและ/หรือท้อแท้ในบริบทที่เกี่ยวข้อง) จาก “ผู้พยากรณ์ในอดีตไม่สามารถคาดการณ์ที่น่าสนใจที่มีเหตุผลได้ มีแนวโน้มที่จะถูกต้อง” อดีตดูเหมือนจริงสำหรับฉัน แต่อย่างหลังไม่

แบบสำรวจของลุคในปี 2019 เกี่ยวกับประวัติลัทธิอนาคตนิยม ระบุเอกสารที่เกี่ยวข้องอีกสองฉบับ ( ที่นี่ และ ที่นี่ ); ฉันไม่ได้อ่านสิ่งเหล่านี้นอกเหนือจากบทคัดย่อ แต่อัตราความแม่นยำโดยรวมคือ 76% และ 37% ตามลำดับ เป็นการยากที่จะตีความตัวเลขเหล่านั้นโดยไม่ได้รู้สึกว่าการทำนายนั้นท้าทายเพียงใด

โพสต์ในฟอรัม EA ปี 2021 ดูที่บันทึกการติดตามรวมของผู้พยากรณ์ใน PredictionBook และ Metaculus รวมถึงการวิเคราะห์เฉพาะของการคาดการณ์ 5 ปีขึ้นไป แม้ว่าฉันจะไม่พบว่าง่ายที่จะสรุปว่าประสิทธิภาพนั้น “ดี” หรือ “แย่” ” (หรือคำถามที่คล้ายกับคำถามที่ฉันสนใจ)

บันทึกการติดตามของนักอนาคตดูเหมือน ... สบายดี บันทึกการติดตามของนักอนาคตดูเหมือน ... สบายดี บันทึกการติดตามของนักอนาคตดูเหมือน ... สบายดี บันทึกการติดตามของนักอนาคตดูเหมือน ... สบายดี

แสดงความคิดเห็น/อภิปราย


เชิงอรรถ

  1. การเปิดเผยข้อมูล: ฉันเป็นซีอีโอร่วมของ Open Philanthropy

  2. ฉันยัง Googled สั้น ๆ สำหรับการคาดคะเนของพวกเขาเพื่อให้ได้รับความรู้สึกเบื้องต้นว่าพวกเขาเป็นประเภทของการคาดการณ์ที่เกี่ยวข้องหรือไม่ ฉันพบบทความสองสามบทความที่แสดงตัวอย่างการคาดคะเนที่ดีและไม่ดี แต่ไม่มีสิ่งใดที่เป็นระบบ ฉันอ้างว่าฉันไม่ได้ออกกำลังกายแบบนี้กับคนอื่นและโยนมันทิ้งไป
  3. นั่นคือถ้าเราไม่มีมีมอยู่เบื้องหลังว่ายากแค่ไหนที่จะทำนายอนาคต
  4. 1 – เป็นที่รู้จักโดยทั่วไปแล้ว

    2 – เป็นฉันทามติของผู้เชี่ยวชาญ

    3 – เก็งกำไร แต่มีแนวโน้ม

    4 – เหนือเทรนด์ หรือมีรายละเอียดที่แปลกประหลาด

    5 – เฉียบขาด ไม่ตกเทรนด์

  5. การคาดการณ์ในชุดข้อมูลน้อยมากนั้นมีอายุน้อยกว่า 30 ปี และฉันก็แค่เพิกเฉย

  6. อาซิมอฟมีเพียงหนึ่งการทำนายที่ไม่ถูกต้องในหมวดหมู่นี้ ดังนั้นสำหรับคำทำนายที่ไม่ถูกต้องครั้งที่ 2 ฉันจึงใช้คำที่มีปัญหา “3” แทน “4”
  7. คำทำนายแรกในรายการนี้เข้าเกณฑ์เกณฑ์ที่เคร่งครัดที่สุดเมื่อผมร่างบทความนี้ขึ้นเป็นครั้งแรก แต่ตอนนี้ถูกปรับเป็นระดับความยาก=3/5 ซึ่งผมไม่เห็นด้วย (ผมคิดว่าเป็นการคาดคะเนที่ประทับใจมาก มากกว่าที่เหลือ ที่มีคุณสมบัติตามความยาก=4/5)
  8. ดู รายงานนี้ เกี่ยวกับการสอบเทียบสำหรับผู้ตรวจสอบทุน Open Philanthropy (แม้ว่าจะเป็นกลุ่มคนที่แตกต่างจากผู้ที่ค้นคว้าเกี่ยวกับไทม์ไลน์ AI ที่เปลี่ยนแปลง)