วารสารศาสตร์ข้อมูล – Data Journalism

เปลี่ยนข้อมูลให้เป็นข่าว

Archive for the ‘practices’ Category

ข้อมูลที่เชื่อใจได้ จะเป็นธุรกิจขององค์กรข่าวในอนาคต

without comments

ในงานสัมมนาเนื่องในวันเสรีภาพสื่อมวลชนโลก เมื่อวันที่ 3 พ.ค. ที่ผ่านมา ประเด็นหนึ่งที่ พิชญ์ พงษ์สวัสดิ์ พูดถึงก็คือ Trust + Tolerance หรือ ความเชื่อใจกัน + ความใจกว้างต่อกัน ซึ่งพิชญ์บอกว่า เป็นสิ่งที่จำเป็นในการจะทำให้พื้นที่อินเทอร์เน็ต เป็นพื้นที่ประชาธิปไตย (democratic space – ซึ่งเป็นวาระอันหนึ่งของ UNDP องค์กรร่วมจัด)

เว็บไซต์ของศูนย์ปฏิบัติการวารสารศาสตร์นีแมน (Nieman Journalism Lab) ได้เผยแพร่บทความ เกี่ยวกับบทบาทในอนาคตขององค์กรข่าว ในฐานะผู้จัดหาข้อมูลที่เชื่อใจได้ ซึ่งในสภาวะที่สังคมมองหาและให้คุณค่าความเชื่อใจได้ บทบาทดังกล่าวจะช่วยให้องค์กรข่าวกลับมามีความหมายกับสังคมอีกครั้ง บทความนี้เขียนโดย เจฟ แมคกี (Geoff McGhee – ผู้ทำโครงการวีดิโอ “วารสารศาสตร์ในยุคของข้อมูล”) ร่วมกับ มีร์โก ลอเรนซ์ (Mirko Lorenz – สถาปนิกสารสนเทศและนักวารสารศาสตร์ชาวเยอรมัน) และ นิโคลัส เคย์เซอร์-บริล (Nicolas Kayser-Bril – หัวหน้าทีมวารสารศาสตร์ข้อมูลที่ OWNI ฝรั่งเศส)

ทั้งสามร่วมกันเสนอว่า องค์กรข่าวควรปรับโครงสร้างตัวเองใหม่ ให้อยู่ในฐานะผู้ผลิต ผู้เสาะหารวบรวม และผู้วิเคราะห์ข้อมูล พวกเขาเชื่อว่าการขายข้อมูลที่เชื่อถือได้ จะเป็นรากฐานอันหนึ่งของรูปแบบธุรกิจใหม่ของวงการวารสารศาสตร์

ข้อถกเถียงหรือข้อเสนอจำนวนหนึ่งได้แก่:

  • องค์กรข่าวจะต้องเปลี่ยนแปลงตัวเองไปสู่ศูนย์กลางข้อมูล
  • ไม่ว่าเทคโนโลยีหรือตลาดจะเปลี่ยนไปอย่างไร แต่บทบาทที่เป็นรากฐานของวารสารศาสตร์นั้นก็จะยังไม่เปลี่ยน นั่นคือ การค้นหาความจริง และการเรียกร้องความรับผิดและตรวจสอบได้จากผู้ที่อยู่ในอำนาจ
  • ไม่ว่ามันจะอยู่ในรูปแบบบทความ วีดิโอ แอพพลิเคชัน หรือ API แต่บทบาทดังกล่าวนี้ก็ยังเหมือนเดิม — หน้าที่ของนักวารสารศาสตร์ก็คือ ใช้ทุกอย่างที่มี เพื่อจะนำเสนอเรื่องหนึ่ง ๆ ให้ได้ดีที่สุด
  • หน้าอาชญากรรมในหนังสือพิมพ์ อาจจะเปลี่ยนไปเป็นแอพพลิเคชัน ที่พล็อตจุดเกิดเหตุทั้งหมดในช่วงเวลาต่าง ๆ
  • เจฟฟ์ จาร์วิส (Jeff Jarvis – ผู้เขียนหนังสือ What Would Google Do?) เคยประกาศไว้เมื่อปี 2008 ว่า “บทความ (article) ไม่ได้เป็นองค์ประกอบแกนหลักของวารสารศาสตร์อีกต่อไปแล้ว” และเสนอว่า “หัวข้อ” (topic) ต่างหาก ที่จะเป็นแกนหลัก (ซึ่งมันมากไปกว่า “บทความ” เฉย ๆ)
  • ความน่าเชื่อถือ-เชื่อใจได้ (trust) – ไม่ใช่สารสนเทศ – เป็นทรัพยากรที่ทุกวันนี้หาได้ยาก ความน่าเชื่อถือเป็นสิ่งที่ได้มาลำบากและเสียไปได้ง่าย และมันคือสิ่งสำคัญในวารสารศาสตร์: มีอาชีพอื่น ๆ อีกไม่กี่อาชีพนักหรอก ที่จำเป็นต้องอาศัยความเชื่อใจมากถึงขนาดนี้
  • Thomson Reuters คือตัวอย่างของบริษัทที่ผลักดันตัวเองจากที่เคยให้ความสนใจกับ ข้อความ มาสู่ ข้อมูล
  • Bloomberg และ Amazon.com คือตัวอย่างของบริษัทที่รู้ว่า แม้เนื้อหาจะมีความสำคัญ แต่วิธีที่นำเสนอเนื้อหา หรือ “ประสบการณ์ของผู้ใช้” (user experience) นั้น ก็มีความสำคัญไปยิ่งหย่อนไปกว่ากัน
  • ทำสะสมไว้ แล้วเก็บเกี่ยวทีหลัง
  • ในทางหลักการ วารสารศาสตร์ข้อมูลก็คือสิ่งที่นักข่าวทำกันมานานแล้ว ไม่มีอะไรแปลกใหม่น่ากลัว นึกถึงหนังสือรวมประกาศ (gazette) ในศตวรรษที่ 17 สิ่งที่นักข่าวทำตั้งแต่ตอนนั้นก็คือ: รวบรวมข้อเท็จจริง, ตรวจสอบ, เขียนเกี่ยวกับมัน
  • สิ่งที่จะต่างไปคือ นักข่าวจะไม่ได้เป็นผู้เก็บรวบรวมข้อเท็จจริงด้วยตัวเอง แต่เป็นผู้ประสานจัดการในการรวบรวม ผู้ใช้จำนวนมากช่วยกันลงมือเก็บข้อมูล ในลักษณะฝูงชนแบ่งงานกันทำ (crowdsourcing) ในอนาคต นักข่าวจะมีหน้าที่คล้ายผู้จัดการโครงการ
  • ในการบริการข้อมูลต่าง ๆ เหล่านี้ องค์กรข่าวสามารถหารายได้จากผู้ใช้กลุ่มต่าง ๆ และคิดราคาที่ต่างกันไปตามความต้องการใช้ประโยชน์ที่ต่างกันจากข้อมูลชิ้นเดียวกัน

อ่านบทความต้นฉบับได้ที่ Media Companies Must Become Trusted Data Hubs, OWNI.eu, Feb 28, 2011 [ผ่าน Nieman Journalism Lab]

Written by bact'

May 6th, 2011 at 1:38 am

วารสารศาสตร์ข้อมูลกับภาพใหญ่

with one comment

บทความ “ความสำคัญที่เพิ่มมากขึ้นของวารสารศาสตร์ข้อมูล” โดย อเล็กซ์ โฮเวิร์ด ได้อ้างถึงโพสต์ของ แอนโธนี เดอบาร์รอส datajournalism.in.th ก็ขอแปลโพสต์ดังกล่าวต่อเลยละกัน

แปลจาก Data Journalism and the Big Picture โดย Anthony DeBarros, 26 พ.ย. 2553

ผู้คนในเว็บในสัปดาห์ที่ผ่านมาได้แสดงความคิดเห็นต่าง ๆ เกี่ยวกับคุณค่าของวารสารศาสตร์ข้อมูล และทักษะที่เกี่ยวข้อง ประเด็นสำคัญ ๆ ก็คือ

  • ทีม เบิร์นสเนอร์-ลี ผู้คิดค้นเวิลด์ไวด์เว็บ บอกกับหนังสือพิมพ์เดอะการ์เดียนว่า “นักข่าวจำเป็นต้องใช้ข้อมูลได้อย่างชำนาญ” และ “วารสารศาสตร์ข้อมูลคืออนาคตต” ข่าวดังกล่าวพูดต่อไปถึงคำถามที่ว่า การวิเคราะห์ข้อมูลจะสามารถแทนที่การรายงานข่าวแบบดั้งเดิมได้หรือไม่
  • บล็อก 10,000 Words ประกาศว่า หนึ่งใน “5 ความเชื่อเกี่ยวกับวารสารศาสตร์ดิจิทัล” คือความเชื่อที่ว่า “นักข่าวจำเป็นต้องมีทักษะในการพัฒนาฐานข้อมูล” และแนะนำว่านักข่าวส่วนใหญ่ควรจะปล่อยการแฮ็ก[1] ระดับสูงให้เป็นเรื่องของผู้เชี่ยวชาญ
  • เว็บไซต์อีกไซต์หนึ่ง คือ FleetStreetBlues[2] ได้แสดงความเห็นว่า “ท่ามกลางความตื่นเต้น ความมุ่งมั่น และความลุ่มหลงในสเปรดชีต แต่นี่คือความจริงเกี่ยวกับสิ่งที่เรียกกันว่า ‘วารสารศาสตร์ข้อมูล’ มันยังคงเกี่ยวกับการเล่าเรื่อง ก็แค่นั้นแหละ”

มีปฏิกริยาตอบต่อโพสต์เหล่านี้จำนวนหนึ่ง รวมไปถึงคนจำนวนหนึ่งที่ชี้ให้เราเห็นถึงข่าวของ Time ชิ้นหนึ่งในปี 1986 [เกี่ยวกับ ฟิล เมเยอร์ นักข่าวที่ใช้คอมพิวเตอร์เพื่อวิเคราะห์สถิติประชากรของประชากรผิวดำในการจลาจลปี 1967 ในดีทรอยต์] ซึ่งคล้ายกับเรื่องที่เราพูดถึงข้างต้นในเดอะการ์เดียนสัปดาห์นี้ และนั่นคือปัญหาของโพสต์ทั้งสามชิ้นดังกล่าว: ไม่มีชิ้นใดเลยในสามชิ้นนั้น ที่มองไปยังภาพใหญ่ มุมมองเชิงประวัติศาสตร์ของวารสารศาสตร์ข้อมูล — ไม่มีการพูดถึงว่ามันมาจากไหน ไม่มีการพูดถึงว่ามันมีการเปลี่ยนแปลงอย่างไร และยิ่งไม่มีการพูดถึงภูมิหลังอันมากมายซึ่งคำว่า “วารสารศาสตร์ข้อมูล” ได้ปิดบังเอาไว้

เราเคยเรียกมันว่า “การใช้คอมพิวเตอร์ช่วยในการรายงานข่าว” (CAR)

ย้อนกลับไปในยุคที่ซอฟต์แวร์ยังมาในแผ่นฟลอปปี้ดิสก์ 5.25 นิ้ว หรืออาจจะก่อนหน้านี้อีก แนวคิดเรื่องการใช้คอมพิวเตอร์ส่วนบุคคลเพื่อ “คิดเลข” ถูกเรียกว่า “การใช้คอมพิวเตอร์ช่วยในการรายงานข่าว” (computer-assisted reporting: CAR) ทุกวันนี้ เราเรียกมันว่าวารสารศาสตร์ข้อมูล นั่นเพราะมันชัดเจนว่า ชื่อเก่านั้นดูจะคลาดเคลื่อน เหมือนกับที่ ฟิล เมเยอร์ (Phil Meyer) เคยพูดไว้ครั้งหนึ่งว่า เราไม่เคยพูดถึงการใช้โทรศัพท์ช่วยในการรายงานข่าวใช่ไหม หรือว่าเราเคย?

ในสมัยที่ผมเข้ามาสู่วงการ — สมัยที่ Paradox นั้นเป็นซอฟต์แวร์จัดการฐานข้อมูลที่เราเลือกใช้ — ห้องข่าวของเรามีคอมพิวเตอร์ส่วนบุคคลหนึ่งเครื่องที่จัดไว้เฉพาะเพื่อเป็น “เครื่อง CAR” ในขณะที่คนอื่น ๆ ใช้เครื่องเทอร์มินัลที่ต่อกับคอมพิวเตอร์เมนเฟรม ผมก็ท่องเว็บด้วยโปรแกรม Netscape และโทรหา พอล โอแวร์แบร์ก (Paul Overberg) เพื่อขอคำปรึกษาเรื่องข้อมูลสำมะโนประชากร ในตอนนั้นผมเป็นผู้เชี่ยวชาญด้านข้อมูลของห้องข่าว คนที่บรรดานักข่าวจะเรียกหาเมื่อพวกเขามีสเปรดชีตบนแผ่นดิสก์หรือความคิดว่าอยากจะได้ข้อมูลจากส่วนราชการท้องถิ่น

ในยุคนั้น — ด้วยบริษัทเว็บตั้งใหม่ซึ่งขับเคลื่อนเว็บด้วยฐานข้อมูล อย่าง Amazon.com ซึ่งกำลังแพร่การปฏิวัติวัฒนธรรมข้อมูล — มันเป็นการง่ายมากที่จะคาดการณ์ถึงช่วงเวลาที่นักข่าวจะไม่เพียงได้รับสเปรดชีตชั่วครั้งชั่วคราว แต่จะพบกับข้อมูลอันท่วมทะลัก และนั่นก็เป็นจุดกำเนิดของการพยายามชักชวนให้ห้องข่าวมาสนใจ CAR (อย่างน้อยก็ในแวดวงของผม) เราสอนโปรแกรม Excel เราส่งคนไปเข้าค่ายอบรมของสมาคมนักข่าวและบรรณาธิการข่าวสืบสวนสอบสวน (Investigative Reporters and Editors: IRE) และเราแสดงข่าวชนิดต่าง ๆ ที่นักข่าวทำด้วยทักษะเหล่านี้ สาสน์ของ CAR นั้นคือการค้นหาข่าวและการใช้เครื่องมือง่าย ๆ ในการทำมัน นั่นคือ สเปรดชีต, ฐานข้อมูล, แผนที่, และสถิติ

ตอนนี้เราเรียกมันว่า “การแฮ็ก”

อย่างไรก็ตาม ในไม่ช้า งานชุดความชำนาญเหล่านี้ก็เปลี่ยนไป เช่นเดียวกับการพูดคุยในงานประชุมการใช้คอมพิวเตอร์ช่วยในการรายงานข่าวของ IRE โดยเฉพาะสำหรับชั้นเรียนปฏิบัติการและการแสดงตัวอย่างเทคโนโลยีต่าง ๆ ในปี 2002 ที่ฟิลาเดลเฟีย ชั้นเรียนปฏิบัติการส่วนใหญ่พูดถึง Access, Excel, SPSS, และสำหรับผู้รักความท้าทายก็มี SQL Server อีกไม่กี่ปีถัดมา ในคลีฟแลนด์และฮิวส์ตัน หัวข้อการประชุมนั้นมีเรื่องการดูดข้อมูลจากหน้าเว็บ, Perl, Python, MySQL, และ Django

การเติบโตของเว็บและความหาได้ง่ายของข้อมูล ได้ช่วยผลักดันความเปลี่ยนแปลงดังกล่าวนี้ ผมยังคิดด้วยว่าบรรดา “ผู้เชี่ยวชาญ CAR” ที่ริเริ่มวารสารศาสตร์ข้อมูลในทศวรรษ 1990 น่าจะรู้สึกอ่อนล้าเหนื่อยหน่ายกับข้อจำกัดของ Access และ Excel จึงได้หาหนทางก้าวไปสู่สิ่งใหม่ ๆ แต่ไม่ว่าจะในทางใดก็ตาม ในตอนที่ PolitiFact ได้รับรางวัลพูลิตเซอร์ ยุคของแอพพิลเคชันข่าวก็บูมอย่างเต็มที่ และความคิดเรื่องนักข่าวที่เป็นโปรแกรมเมอร์ด้วย ก็เป็นขั้นต่อไปตามวิวัฒนาการตามธรรมชาติของวารสารศาสตร์ข้อมูล สวัสดี Hacks/Hackers

แต่สารในชุมชน CAR (ในตอนนี้คือ วารสารศาสตร์ข้อมูล) ก็ยังเหมือนเดิมไม่เปลี่ยนแปลง: เราใช้เครื่องมือเหล่านี้เพื่อค้นหาและเล่าข่าว เราใช้มันเหมือนเราใช้โทรศัพท์ ข่าวยังคงเป็นสิ่งสำคัญสิ่งเดียว

มองจากข้างนอกเข้าไปข้างใน

กลับไปที่เรื่องในสัปดาห์นี้ที่เราได้พูดถึงทั้งสามชิ้น แม้จะแตกต่างกันโดยสิ้นเชิงแต่พวกมันก็ยังเกี่ยวข้องกัน หนึ่งในนั้นได้ทำให้ผู้ได้รับรางวัลพูลิตเซอร์ [แมตต์ เวต (Matt Waite) นักข่าวผู้พัฒนา PolitiFact.com] รู้สึกเดือดดาล โพสต์แต่ละชิ้นได้พลาดประเด็นสำคัญไป เนื่องจากมันได้คิดถึงบริบทดังกล่าว:

  • แม้ ทิม เบิร์สเนอส์-ลี จะเคยเป็นผู้บุกเบิกเว็บ แต่เขามาสายในขบวนนี้ ในเวลาที่เขาประกาศว่าวารสารศาสตร์ข้อมูลนั้น “เป็นอนาคต” อนาคตดังกล่าวได้ผ่านไปแล้ว ความสามารถในการรับมือกับข้อมูลไม่ได้เป็นทักษะที่นักข่าวควรจะเรียนรู้อีกต่อไป — มันเป็นทักษะในการดำรงชีวิตขั้นพื้นฐาน ที่ลูก ๆ ของผมเรียนในโรงเรียนมัธยม มากไปกว่านั้น ผมยังนึกไม่ออกว่าเคยมีไหมในช่วงสิบห้าปีที่ผ่านมา ที่ใครสักคนในชุมชน CAR ได้แนะนำว่า วารสารศาสตร์ข้อมูลเป็นสิ่งที่มาแทนที่การออกไปเดินหาข่าว ค้นเอกสาร และหาทางยืนยันความน่าเชื่อถือของข้อมูลเหล่านั้น (shoe-leather reporting) ซึ่งผู้เขียนรายงานชิ้นดังกล่าวได้บอกกับผมว่า เขาตอบโต้กับความเกินจริงในคำประกาศของเบิร์นสเนอร์-ลี และไม่ได้กำลังประเมินค่าความเป็นจริงของสิ่งที่ถูกปฏิบัติอยู่
  • ตลอดเวลาที่ผ่านมา ชุมชน CAR/วารสารศาสตร์ข้อมูล ได้มุ่งมั่นสร้างทักษะเหล่านี้ให้กับผู้คน ค่ายอบรมสำหรับผู้เริ่มต้นที่การประชุมการใช้คอมพิวเตอร์ช่วยในการรายงานข่าวของ IRE แต่ละปี ได้สอนให้คนใช้ Excel และ Access — มันเป็นจุดเริ่มต้นที่ยอดเยี่ยม แต่ผมไม่ได้บอกกับพวกเขาว่ามันมีข้อจำกัดในสิ่งที่พวกเขาสามารถทำได้ ในทางเดียวกันกับที่ศาสตร์ด้านทั้งหมดได้วิวัฒนาการ นักข่าวที่ได้เข้ามาสู่เส้นทางนี้ มักจะก้าวไปสู่ทักษะที่ซับซ้อนเพิ่มขึ้น ข้อจำกัดเพียงอย่างเดียวที่จะมีก็คือข้อจำกัดที่พวกเขาตั้งขึ้นมาเพื่อจำกัดตัวพวกเขาเอง ที่จริงแล้ว ความเชื่อเพียงอย่างเดียว ที่จำเป็นจะต้องกำจัดไป ณ ที่นี้ก็คือ ความเชื่อที่บอกว่าคุณต้องฉลาดแบบไอน์สไตน์ ถึงจะเรียนรู้สิ่งเหล่านี้ได้ หรือจำเป็นจะต้องมีสมองซีกซ้ายและขวาที่สมดุลกันอย่างวิเศษ ไม่มีเรื่องอะไรแบบนั้นเลย คุณเพียงต้องทำมันอย่างไม่ลดละเท่านั้น
  • “มันยังคงเป็นเรื่องของการเล่าข่าว” มันไม่เคยเป็นอย่างอื่น คำอธิบายโดยผู้อภิปรายในการประชุมการใช้คอมพิวเตอร์ช่วยในการรายงานข่าว โดยสมาคมนักข่าวและบรรณาธิการข่าวสืบสวนสอบสวน ในช่วงสิบปีที่ผ่านมา ได้แสดงให้เห็นอย่างชัดเจนอยู่แล้ว

ชุดของความคิดเห็นเหล่านี้ ควรจะเตือนเราว่า สาเหตุที่เราจำเป็นต้องมีองค์กรอย่าง IRE, Hacks/Hackers, และองค์กรอื่น ๆ นั้นไม่ใช่เพียงเพื่อถ่ายทอดทักษะ แต่ยังเพื่อมอบบริบทว่าทำไมทักษะเหล่านี้จึงมีความสำคัญเหลือเกิน


[1] “การแฮ็ก” (hacking) ในที่นี้ หมายถึงกิจกรรมการดัดแปลงหรือต่อเติมสิ่งของให้มีความสามารถหรือประโยชน์เพิ่มเติมไปจากเดิม และในบางครั้งก็ด้วยวิธีการแปลก ๆ ใหม่ ๆ ที่ไม่เคยมีคนทำมาก่อน หรือด้วยวิธีการที่ใช้อุปกรณ์ทั่ว ๆ ไปที่หาซื้อได้ตามท้องตลาด โดยเรียกกลุ่มคนที่มีความสนใจด้านนี้ว่า “แฮ็กเกอร์” (hackers) ^

[2] Fleet Street หรือถนนฟลีต เป็นถนนสายหนึ่งในกรุงลอนดอน ซึ่งเคยเป็นที่ตั้งของสำนักข่าวและหนังสือพิมพ์จำนวนมาก แม้ทุกวันนี้สำนักข่าวรายใหญ่จะย้ายไปอยู่ที่อื่นหมดแล้ว แต่คำว่า “ถนนฟลีต” ก็ยังเป็นคำที่ใช้หมายถึง “แวดวงสื่ออังกฤษ” อยู่ ^

Written by bact'

May 3rd, 2011 at 2:37 am

O’Reilly Radar: ความสำคัญที่เพิ่มมากขึ้นของวารสารศาสตร์ข้อมูล

without comments

แปลจาก The growing importance of data journalism โดย Alex Howard (@digiphile) 21 ธันวาคม 2553

การวิเคราะห์จำแนกความก้าวหน้าของข้อมูลภาครัฐ จำเป็นต้องใช้เครื่องมือใหม่ ๆ และแหล่งข้อมูลที่ไว้ใจได้

หนึ่งในประเด็นหลักจากงาน News Foo ที่ยังคงดังก้องอยู่ในหัวผมก็คือ ความสำคัญของวารสารศาสตร์ข้อมูล ความชำนิชำนาญในเรื่องดังกล่าวได้รับความสนใจอีกครั้งในฤดูหนาวนี้ เมื่อ ทิม เบอร์เนิร์ส-ลี [ผู้คิดค้นเวิลด์ไวด์เว็บ] ระบุว่าความสามารถในการวิเคราะห์ข้อมูลคืออนาคตของวารสารศาสตร์

เมื่อคุณมองไปที่วารสารศาสตร์ข้อมูลกับภาพใหญ่ เหมือนกับที่ แอนโธนี เดอบาร์รอส แห่งหนังสือพิมพ์ยูเอสเอทูเดย์ ได้ทำและเขียนในบล็อกของเขาเมื่อเดือนพฤศจิกายนที่ผ่านมา มันชัดเจนว่าเทคโนโลยีต่าง ๆ ในขณะนี้ เป็นพัฒนาการของการเล่าเรื่องที่ถูกยกระดับขึ้นด้วยเทคโนโลยี ซึ่งสืบย้อนไปได้ถึงการใช้คอมพิวเตอร์ช่วยในการรายงานข่าว (computer-assisted reporting – CAR).

เหมือนกับที่เดอบาร์รอสชี้ให้เราเห็น สิ่งที่ CAR ต้องการจะบอก “นั้นเกี่ยวกับการค้นหาเรื่องราว และใช้เครื่องมือง่าย ๆ เพื่อทำมัน: ตารางคำนวณ, ฐานข้อมูล, แผนที่, สถิติ” เช่น ไมโครซอฟท์แอคเซส, เอกซ์เซล, SPSS, และเอสคิวแอล เซิร์ฟเวอร์
สิ่งเหล่านั้นยังคงเป็นจริงอยู่ในปัจจุบัน แม้นักวารสารข้อมูลในตอนนี้จะมีเครื่องมือใหม่ ๆ ที่ทรงพลังสำหรับการเก็บเล็กผสมน้อยข้อมูลจากเว็บ ด้วยเครื่องมืออย่าง ScraperWiki และ Needlebase, เขียนโปรแกรมสคริปต์ด้วย Perl, หรือ Ruby, Python, MySQL และ Django

การทำความเข้าใจกับประวัติศาสตร์ของการใช้คอมพิวเตอร์ช่วยในการรายงานข่าว เป็นกุญแจสำคัญที่จะวางเครื่องมือใหม่ ๆ เหล่านี้ ลงไปในบริบทที่เหมาะสม “เราใช้เครื่องมือเหล่านี้เพื่อค้นหาและเล่าเรื่อง” เดอบาร์รอสเขียน “เราใช้มันเหมือนที่เราใช้โทรศัพท์ เรื่องราวยังคงเป็นสิ่งสำคัญสิ่งเดียว”

การประชุมเรื่องวารสารศาสตร์ข้อมูลที่งาน News Foo นั้น มีขึ้นในวันเดียวกับที่นักพัฒนาพลเมืองได้เข้าร่วมในมหกรรม “open data hackathon” ซึ่งมีขึ้นทั่วโลก [รวมถึงประเทศไทย] และหนังสือพิมพ์นิวยอร์กไทมส์ได้เป็นเจ้าภาพจัดงาน Times Open Hack Day นักพัฒนาจำนวนมากในการประกวดลักษณะนี้ มีความสนใจที่จะทำงานกับข้อมูลแบบเปิด แต่บทสนทนาที่ News Foo ก็ได้แสดงให้เห็นว่า หน่วยงานรัฐบาลยังคงต้องทำงานอีกมากแค่ไหน เพื่อที่จะทำสัญญาที่จะเปิดเผยข้อมูลที่รัฐบาลเก็บเอาไว้เพื่ออนาคตของวารสารศาสตร์ ให้กลายเป็นจริง

ประเด็นปัญหาที่พบนั้นสำคัญอย่างมาก ข้อมูลภาครัฐนั้นมักจะ “สกปรก” ไปด้วยช่องข้อมูลที่ผิดพลาดหรือไม่มีเมตาดาตา
นักข่าวจำเป็นต้องตรวจเช็คความถูกต้องและทำความสะอาดชุดข้อมูล ด้วยเครื่องมือเช่น Google Refine โครงการ Recovery Tracker ของเว็บไซต์ข่าว ProPublica ซึ่งช่วยติดตามข้อมูลงบประมาณและแผนกระตุ้นเศรษฐกิของสหรัฐ เป็นหนึ่งในตัวอย่างที่ดีที่สุดของการปฏิบัติการดังกล่าวในชีวิตจริง [ProPublica ดึงข้อมูลมาจากเว็บไซต์ Recovery.gov ของรัฐบาล ทำความสะอาดข้อมูล และเพิ่มเติมข้อมูลที่ขาดหายไป เพื่อให้ชุดข้อมูลนำไปใช้ได้จริง]

มาตรฐานอันสูงสุดเมื่อเร็ว ๆ นี้สำหรับวารสารศาสตร์ข้อมูล ก็คือโครงการ Toxic Waters จากนิวยอร์กไทมส์ ซึ่งชนะรางวัลพูลิตเซอร์ ขนาดของโครงการดังกล่าวทำให้มันยากที่จะติดตาม อย่างไรก็ตามนักพัฒนาของไทมส์ก็ยังทำงานอย่างหนักกับโครงการเจ๋ง ๆ อย่าง Inside Congress

คุณสามารถดูการสร้างภาพข้อมูลจากโครงการ Toxic Waters และตัวอย่างอื่น ๆ ของวารสารศาสตร์ข้อมูล ได้จากการนำเสนอในแบบ Ignite จากงาน News Foo

ที่ ProPublica ทีมวารสารศาสตร์ข้อมูลนั้นตระหนักถึงการเชื่อมโยงระดับลึกลงไปสู่แอพพลิเคชั่นข่าว ด้วยทัศนะที่ว่าภาพข้อมูลที่ถูกสร้างขึ้นจากแอพพลิเคชั่นเหล่านั้น ในตัวของพวกมันเองก็เป็นรูปแบบหนึ่งของการเสนอข่าวแบบพรรณนา ด้วยการวาดภาพข้อมูลที่เยี่ยมยอด ผู้อ่านสามารถค้นพบหนทางและซักไซ้ไล่เรียงข้อมูลดังกล่าวได้ด้วยตัวของพวกเขาเอง มากไปกว่านั้น ความแตกต่างระหว่าง “เรื่อง” ข่าว และ “แอพ” ข่าว ก็จะค่อย ๆ สลายไป เมื่อผู้อ่านรับข่าวสารมากขึ้น ๆ จากอุปกรณ์เคลื่อนที่และแท็บเล็ต

วิธีหนึ่งในการมอบบริบทที่เป็นประโยชน์แก่ผู้อ่าน ก็คือรูปแบบ “ไอออน” (ion) ที่เว็บไซต์ข่าว ProPublica.org ทำอยู่ โครงการอย่าง “Eye on the Stimulus” เป็นลูกผสมระหว่างบล็อกและแอพพลิเคชั่น ในด้านหนึ่งของหน้าเว็บดังกล่าว มันเป็นสายธารของข่าวที่ไหลอยู่ตลอดเวลา ในอีกด้านหนึ่ง มันมีจุดเข้าไปสู่ข้อมูลต่าง ๆ ความท้าทายของวิธีการนี้ก็คือ ช่องทางเสนอสื่อจะต้องมีการจัดขบวนระหว่างทีมงานและเรื่องราว นักข่าวจำเป็นต้องปรับข้อมูลทุกวัน สำหรับข่าวที่กำลังมีความเคลื่อนไหวอยู่ตลอดซึ่งอ่อนไหวต่อข้อมูล

อัปเกรด Data.gov

ช่วงการประชุมวารสารศาสตร์ข้อมูลในงาน News Foo มีองค์ประกอบที่เป็นแก่นอย่างหนึ่งคือ มันได้นำผู้ก่อตั้ง City Camp เควิน เคอร์รี่, ผู้เผยแพร่แนวคิด Data.gov จีน โฮล์ม, และผู้ได้รับทุนมูลนิธิเรย์โนลด์ส เดวิด แฮร์ซอก พร้อมกับผู้เข้าร่วมงาน News Foo ให้ได้พูดคุยเกี่ยวกับการให้คุณค่าของ ข้อมูลภาครัฐแบบเปิด และ วารสารศาสตร์ข้อมูล

ดังที่รายงานการศึกษาข้อมูลแบบเปิดฉบับล่าสุดได้แสดง นักพัฒนานั้นไม่พบข้อมูลภาครัฐที่ตัวเองจำเป็นต้องใช้หรือต้องการจะใช้ ถ้ามีผู้ประกอบการรายอื่น ๆ ต้องการเดินตามรอยของ BrightScope ชุดข้อมูลแบบเปิดของภาครัฐจะต้องเชื่อมโยงเกี่ยวข้องให้มากขึ้นกับธุรกิจ เสียงตอบรับสำหรับ Data.gov และคลังข้อมูลภาครัฐอื่น ๆ นั้นชัดเจน: ข้อมูลที่มากขึ้น ข้อมูลที่ดีขึ้น และข้อมูลที่สะอาดขึ้น กรุณาด้วย

การพัฒนาให้สื่อเข้าถึงข้อมูลได้ดีขึ้น ในระดับรัฐบาลเขตหรือรัฐบาลมลรัฐ นั้นมีอุปสรรคเชิงโครงสร้าง เนื่องจากวิกฤตงบประมาณที่ขยายตัวมากขึ้นในหน่วยงานรัฐทั่วสหรัฐอเมริกา ดังเช่นที่ จีน โฮล์ม ได้สังเกตเห็นระหว่างการประชุม News Foo โครงการริเริ่มด้านรัฐบาลเปิดนั้นมีแนวโน้มจะถูกดำเนินการในสภาพแวดล้อมที่ใช้งบประมาณแบบผลรวมเป็นศูนย์ในปี 2554 เจ้าหน้าที่รัฐต่าง ๆ จำเป็นต้องทำให้โครงการของตัวเองยั่งยืนและเลี้ยงตัวเองได้

มันมีบางเรื่องที่รัฐบาลสหพันธ์สามารถจะช่วยได้ โฮล์มบอกว่า Data.gov ได้สร้างโฮสต์คอมพิวเตอร์แบบกลุ่มเมฆ (cloud) ซึ่งสามารถจะแบ่งใช้กับรัฐบาลมลรัฐ รัฐบาลท้องถิ่น และรัฐบาลชุมชน Data.gov ยังได้ออกชุดเครื่องมือที่จะช่วยในการแปลงข้อมูล แปลงภาพอักษรเป็นข้อความ (โอซีอาร์) และในอนาคตจะมีเครื่องมือที่ดีขึ้นสำหรับข้อมูลแบบมีโครงสร้าง

ทรัพยากรดังกล่าวเหล่านั้น จะสามารถทำให้ข้อมูลภาครัฐมีพร้อมใช้มากขึ้นและเข้าถึงได้มากขึ้นสำหรับสื่อ เควิน เคอร์รี่ กล่าวว่าบัญชีข้อมูลนั้นเกิดขึ้นใหม่ในทุกที่ [ของประเทศไทย] เขาชี้ไปที่ CivicApps ในพอร์ตแลนด์ โอเรกอน ที่ซึ่งงานที่ แมกซ์ อ็อกเดน ได้ทำกับการเขียนโค้ดซอฟต์แวร์มิดเดิลแวร์สำหรับรัฐบาลแบบเปิด ได้นำไปสู่การแปลงข้อมูลภาครัฐไปสู่รูปแบบที่เป็นประโยชน์มากกว่าสำหรับนักพัฒนา

นักวารสารข้อมูลยังประสบกับความท้าทายทางวัฒนธรรมของภาครัฐ มันเป็นเรื่องยากที่จะพบเจ้าหน้าที่สารสนเทศภาครัฐที่มีความปราถนาหรือมีความสามารถที่จะถามคำถามสำคัญ ๆ เกี่ยวกับข้อมูล โฮล์มบอกว่า Data.gov อาจจะประกาศข้อมูลติดต่อให้มากขึ้นออนไลน์ และสร้างบทสนทนาให้มากขึ้นรอบ ๆ ชุดข้อมูลแต่ละชุด ข้อมูลลักษณะดังกล่าวเป็นจุดเริ่มต้นที่ดีสำหรับการค้นหาข้อกังวลเกี่ยวกับข้อมูลในระดับสหพันธ์ อย่างไรก็ตาม การสนับสนุนความสัมพันธ์ที่เป็นประโยชน์ระหว่างนักข่าวและข้อมูลยังต้องการความพยายามและการพัฒนาให้ดีขึ้นไปอีก

ข่าวที่เกี่ยวข้องจาก O’Reilly Radar:

Written by bact'

April 24th, 2011 at 2:26 am

เบื้องหลังการทำงานของทีมข้อมูล The Guardian

without comments

หนังสือพิมพ์ชื่อดังจากอังกฤษ The Guardian เป็นสำนักข่าวหนึ่งที่มีการนำเสนอข้อมูลได้อย่างน่าสนใจ (ติดตามได้จากบล็อกเรื่องวารสารศาสตร์ข้อมูลโดยเฉพาะ) และยังเผยแพร่ความรู้เกี่ยวกับการนำข้อมูลไปใช้ประโยชน์อีกด้วย

และทีมข้อมูลของ The Guardian ก็ได้เขียนบล็อกเล่าเบื้องหลังว่า กว่าจะเขียนข่าวด้านข้อมูลแต่ละชิ้นนั้น มีกระบวนการอะไรเกิดขึ้นบ้าง

สไลด์แสดงกระบวนการของทีมข้อมูล The Guardian

ซึ่งกระบวนการทั้งหมดก็อาจจะสรุปคร่าว ๆ ได้ดังนี้

  • หาข้อมูลดิบ
  • ออกแบบการนำเสนอ เช่น ใช้ร่วมกับข้อมูลชุดใด ใช้การนำเสนอแบบใด
  • “ทำความสะอาด” ข้อมูล เช่น จัดระเบียบรูปแบบข้อความ แปลงหน่วยตัวเลข ฯลฯ
  • ทำการคำนวณสิ่งที่ต้องการแสดง
  • เลือกเครื่องมือในการแสดงผล

ผู้เขียนยังบอกอีกว่าจะพูดลงรายละเอียดต่อไป ก็ต้องคอยติดตามดูกัน

Written by admin

April 8th, 2011 at 12:27 am

Posted in practices

Tagged with ,