วารสารศาสตร์ข้อมูล – Data Journalism

เปลี่ยนข้อมูลให้เป็นข่าว

Archive for the ‘News Foo’ tag

O’Reilly Radar: ความสำคัญที่เพิ่มมากขึ้นของวารสารศาสตร์ข้อมูล

without comments

แปลจาก The growing importance of data journalism โดย Alex Howard (@digiphile) 21 ธันวาคม 2553

การวิเคราะห์จำแนกความก้าวหน้าของข้อมูลภาครัฐ จำเป็นต้องใช้เครื่องมือใหม่ ๆ และแหล่งข้อมูลที่ไว้ใจได้

หนึ่งในประเด็นหลักจากงาน News Foo ที่ยังคงดังก้องอยู่ในหัวผมก็คือ ความสำคัญของวารสารศาสตร์ข้อมูล ความชำนิชำนาญในเรื่องดังกล่าวได้รับความสนใจอีกครั้งในฤดูหนาวนี้ เมื่อ ทิม เบอร์เนิร์ส-ลี [ผู้คิดค้นเวิลด์ไวด์เว็บ] ระบุว่าความสามารถในการวิเคราะห์ข้อมูลคืออนาคตของวารสารศาสตร์

เมื่อคุณมองไปที่วารสารศาสตร์ข้อมูลกับภาพใหญ่ เหมือนกับที่ แอนโธนี เดอบาร์รอส แห่งหนังสือพิมพ์ยูเอสเอทูเดย์ ได้ทำและเขียนในบล็อกของเขาเมื่อเดือนพฤศจิกายนที่ผ่านมา มันชัดเจนว่าเทคโนโลยีต่าง ๆ ในขณะนี้ เป็นพัฒนาการของการเล่าเรื่องที่ถูกยกระดับขึ้นด้วยเทคโนโลยี ซึ่งสืบย้อนไปได้ถึงการใช้คอมพิวเตอร์ช่วยในการรายงานข่าว (computer-assisted reporting – CAR).

เหมือนกับที่เดอบาร์รอสชี้ให้เราเห็น สิ่งที่ CAR ต้องการจะบอก “นั้นเกี่ยวกับการค้นหาเรื่องราว และใช้เครื่องมือง่าย ๆ เพื่อทำมัน: ตารางคำนวณ, ฐานข้อมูล, แผนที่, สถิติ” เช่น ไมโครซอฟท์แอคเซส, เอกซ์เซล, SPSS, และเอสคิวแอล เซิร์ฟเวอร์
สิ่งเหล่านั้นยังคงเป็นจริงอยู่ในปัจจุบัน แม้นักวารสารข้อมูลในตอนนี้จะมีเครื่องมือใหม่ ๆ ที่ทรงพลังสำหรับการเก็บเล็กผสมน้อยข้อมูลจากเว็บ ด้วยเครื่องมืออย่าง ScraperWiki และ Needlebase, เขียนโปรแกรมสคริปต์ด้วย Perl, หรือ Ruby, Python, MySQL และ Django

การทำความเข้าใจกับประวัติศาสตร์ของการใช้คอมพิวเตอร์ช่วยในการรายงานข่าว เป็นกุญแจสำคัญที่จะวางเครื่องมือใหม่ ๆ เหล่านี้ ลงไปในบริบทที่เหมาะสม “เราใช้เครื่องมือเหล่านี้เพื่อค้นหาและเล่าเรื่อง” เดอบาร์รอสเขียน “เราใช้มันเหมือนที่เราใช้โทรศัพท์ เรื่องราวยังคงเป็นสิ่งสำคัญสิ่งเดียว”

การประชุมเรื่องวารสารศาสตร์ข้อมูลที่งาน News Foo นั้น มีขึ้นในวันเดียวกับที่นักพัฒนาพลเมืองได้เข้าร่วมในมหกรรม “open data hackathon” ซึ่งมีขึ้นทั่วโลก [รวมถึงประเทศไทย] และหนังสือพิมพ์นิวยอร์กไทมส์ได้เป็นเจ้าภาพจัดงาน Times Open Hack Day นักพัฒนาจำนวนมากในการประกวดลักษณะนี้ มีความสนใจที่จะทำงานกับข้อมูลแบบเปิด แต่บทสนทนาที่ News Foo ก็ได้แสดงให้เห็นว่า หน่วยงานรัฐบาลยังคงต้องทำงานอีกมากแค่ไหน เพื่อที่จะทำสัญญาที่จะเปิดเผยข้อมูลที่รัฐบาลเก็บเอาไว้เพื่ออนาคตของวารสารศาสตร์ ให้กลายเป็นจริง

ประเด็นปัญหาที่พบนั้นสำคัญอย่างมาก ข้อมูลภาครัฐนั้นมักจะ “สกปรก” ไปด้วยช่องข้อมูลที่ผิดพลาดหรือไม่มีเมตาดาตา
นักข่าวจำเป็นต้องตรวจเช็คความถูกต้องและทำความสะอาดชุดข้อมูล ด้วยเครื่องมือเช่น Google Refine โครงการ Recovery Tracker ของเว็บไซต์ข่าว ProPublica ซึ่งช่วยติดตามข้อมูลงบประมาณและแผนกระตุ้นเศรษฐกิของสหรัฐ เป็นหนึ่งในตัวอย่างที่ดีที่สุดของการปฏิบัติการดังกล่าวในชีวิตจริง [ProPublica ดึงข้อมูลมาจากเว็บไซต์ Recovery.gov ของรัฐบาล ทำความสะอาดข้อมูล และเพิ่มเติมข้อมูลที่ขาดหายไป เพื่อให้ชุดข้อมูลนำไปใช้ได้จริง]

มาตรฐานอันสูงสุดเมื่อเร็ว ๆ นี้สำหรับวารสารศาสตร์ข้อมูล ก็คือโครงการ Toxic Waters จากนิวยอร์กไทมส์ ซึ่งชนะรางวัลพูลิตเซอร์ ขนาดของโครงการดังกล่าวทำให้มันยากที่จะติดตาม อย่างไรก็ตามนักพัฒนาของไทมส์ก็ยังทำงานอย่างหนักกับโครงการเจ๋ง ๆ อย่าง Inside Congress

คุณสามารถดูการสร้างภาพข้อมูลจากโครงการ Toxic Waters และตัวอย่างอื่น ๆ ของวารสารศาสตร์ข้อมูล ได้จากการนำเสนอในแบบ Ignite จากงาน News Foo

ที่ ProPublica ทีมวารสารศาสตร์ข้อมูลนั้นตระหนักถึงการเชื่อมโยงระดับลึกลงไปสู่แอพพลิเคชั่นข่าว ด้วยทัศนะที่ว่าภาพข้อมูลที่ถูกสร้างขึ้นจากแอพพลิเคชั่นเหล่านั้น ในตัวของพวกมันเองก็เป็นรูปแบบหนึ่งของการเสนอข่าวแบบพรรณนา ด้วยการวาดภาพข้อมูลที่เยี่ยมยอด ผู้อ่านสามารถค้นพบหนทางและซักไซ้ไล่เรียงข้อมูลดังกล่าวได้ด้วยตัวของพวกเขาเอง มากไปกว่านั้น ความแตกต่างระหว่าง “เรื่อง” ข่าว และ “แอพ” ข่าว ก็จะค่อย ๆ สลายไป เมื่อผู้อ่านรับข่าวสารมากขึ้น ๆ จากอุปกรณ์เคลื่อนที่และแท็บเล็ต

วิธีหนึ่งในการมอบบริบทที่เป็นประโยชน์แก่ผู้อ่าน ก็คือรูปแบบ “ไอออน” (ion) ที่เว็บไซต์ข่าว ProPublica.org ทำอยู่ โครงการอย่าง “Eye on the Stimulus” เป็นลูกผสมระหว่างบล็อกและแอพพลิเคชั่น ในด้านหนึ่งของหน้าเว็บดังกล่าว มันเป็นสายธารของข่าวที่ไหลอยู่ตลอดเวลา ในอีกด้านหนึ่ง มันมีจุดเข้าไปสู่ข้อมูลต่าง ๆ ความท้าทายของวิธีการนี้ก็คือ ช่องทางเสนอสื่อจะต้องมีการจัดขบวนระหว่างทีมงานและเรื่องราว นักข่าวจำเป็นต้องปรับข้อมูลทุกวัน สำหรับข่าวที่กำลังมีความเคลื่อนไหวอยู่ตลอดซึ่งอ่อนไหวต่อข้อมูล

อัปเกรด Data.gov

ช่วงการประชุมวารสารศาสตร์ข้อมูลในงาน News Foo มีองค์ประกอบที่เป็นแก่นอย่างหนึ่งคือ มันได้นำผู้ก่อตั้ง City Camp เควิน เคอร์รี่, ผู้เผยแพร่แนวคิด Data.gov จีน โฮล์ม, และผู้ได้รับทุนมูลนิธิเรย์โนลด์ส เดวิด แฮร์ซอก พร้อมกับผู้เข้าร่วมงาน News Foo ให้ได้พูดคุยเกี่ยวกับการให้คุณค่าของ ข้อมูลภาครัฐแบบเปิด และ วารสารศาสตร์ข้อมูล

ดังที่รายงานการศึกษาข้อมูลแบบเปิดฉบับล่าสุดได้แสดง นักพัฒนานั้นไม่พบข้อมูลภาครัฐที่ตัวเองจำเป็นต้องใช้หรือต้องการจะใช้ ถ้ามีผู้ประกอบการรายอื่น ๆ ต้องการเดินตามรอยของ BrightScope ชุดข้อมูลแบบเปิดของภาครัฐจะต้องเชื่อมโยงเกี่ยวข้องให้มากขึ้นกับธุรกิจ เสียงตอบรับสำหรับ Data.gov และคลังข้อมูลภาครัฐอื่น ๆ นั้นชัดเจน: ข้อมูลที่มากขึ้น ข้อมูลที่ดีขึ้น และข้อมูลที่สะอาดขึ้น กรุณาด้วย

การพัฒนาให้สื่อเข้าถึงข้อมูลได้ดีขึ้น ในระดับรัฐบาลเขตหรือรัฐบาลมลรัฐ นั้นมีอุปสรรคเชิงโครงสร้าง เนื่องจากวิกฤตงบประมาณที่ขยายตัวมากขึ้นในหน่วยงานรัฐทั่วสหรัฐอเมริกา ดังเช่นที่ จีน โฮล์ม ได้สังเกตเห็นระหว่างการประชุม News Foo โครงการริเริ่มด้านรัฐบาลเปิดนั้นมีแนวโน้มจะถูกดำเนินการในสภาพแวดล้อมที่ใช้งบประมาณแบบผลรวมเป็นศูนย์ในปี 2554 เจ้าหน้าที่รัฐต่าง ๆ จำเป็นต้องทำให้โครงการของตัวเองยั่งยืนและเลี้ยงตัวเองได้

มันมีบางเรื่องที่รัฐบาลสหพันธ์สามารถจะช่วยได้ โฮล์มบอกว่า Data.gov ได้สร้างโฮสต์คอมพิวเตอร์แบบกลุ่มเมฆ (cloud) ซึ่งสามารถจะแบ่งใช้กับรัฐบาลมลรัฐ รัฐบาลท้องถิ่น และรัฐบาลชุมชน Data.gov ยังได้ออกชุดเครื่องมือที่จะช่วยในการแปลงข้อมูล แปลงภาพอักษรเป็นข้อความ (โอซีอาร์) และในอนาคตจะมีเครื่องมือที่ดีขึ้นสำหรับข้อมูลแบบมีโครงสร้าง

ทรัพยากรดังกล่าวเหล่านั้น จะสามารถทำให้ข้อมูลภาครัฐมีพร้อมใช้มากขึ้นและเข้าถึงได้มากขึ้นสำหรับสื่อ เควิน เคอร์รี่ กล่าวว่าบัญชีข้อมูลนั้นเกิดขึ้นใหม่ในทุกที่ [ของประเทศไทย] เขาชี้ไปที่ CivicApps ในพอร์ตแลนด์ โอเรกอน ที่ซึ่งงานที่ แมกซ์ อ็อกเดน ได้ทำกับการเขียนโค้ดซอฟต์แวร์มิดเดิลแวร์สำหรับรัฐบาลแบบเปิด ได้นำไปสู่การแปลงข้อมูลภาครัฐไปสู่รูปแบบที่เป็นประโยชน์มากกว่าสำหรับนักพัฒนา

นักวารสารข้อมูลยังประสบกับความท้าทายทางวัฒนธรรมของภาครัฐ มันเป็นเรื่องยากที่จะพบเจ้าหน้าที่สารสนเทศภาครัฐที่มีความปราถนาหรือมีความสามารถที่จะถามคำถามสำคัญ ๆ เกี่ยวกับข้อมูล โฮล์มบอกว่า Data.gov อาจจะประกาศข้อมูลติดต่อให้มากขึ้นออนไลน์ และสร้างบทสนทนาให้มากขึ้นรอบ ๆ ชุดข้อมูลแต่ละชุด ข้อมูลลักษณะดังกล่าวเป็นจุดเริ่มต้นที่ดีสำหรับการค้นหาข้อกังวลเกี่ยวกับข้อมูลในระดับสหพันธ์ อย่างไรก็ตาม การสนับสนุนความสัมพันธ์ที่เป็นประโยชน์ระหว่างนักข่าวและข้อมูลยังต้องการความพยายามและการพัฒนาให้ดีขึ้นไปอีก

ข่าวที่เกี่ยวข้องจาก O’Reilly Radar:

Written by bact'

April 24th, 2011 at 2:26 am