Archive for the ‘tools’ Category
ใช้ Google Refine ทำความสะอาดข้อมูล
Google Refine เป็นเครื่องมือสำหรับทำความสะอาดข้อมูล เช่น รวมกลุ่มข้อมูลที่ชื่อหมวดอาจจะสะกดต่างกันเล็ก ๆ น้อย ๆ (เช่น มีช่องว่าง ใช้ตัวย่อ ตัวไม่ย่อ) ให้มาเป็นหมวดเดียวกัน, มองหาข้อมูลที่อาจจะผิดพลาด หรืออยู่ในหน่วยนับอื่น เพื่อให้สุดท้ายแล้ว เรามีข้อมูลที่นำไปประมวลผลได้ง่ายขึ้น มองเห็นภาพใหญ่ได้มากขึ้น
Google Refine ทำงานบนเครื่องคอมของเราเอง ผ่านหน้าจอเบราว์เซอร์ โดยไม่ได้อัปโหลดข้อมูลของเรา ซึ่งอาจจะอ่อนไหว ไปที่เซิร์ฟเวอร์ไหน
“ประเทศไทยอยู่ตรงไหน” – การเปรียบเทียบข้อมูลด้วยแผนที่
เมื่อไม่นานมานี้ไปเจอ Facebook Page อันนึงที่น่าสนใจมาก ชื่อว่า ประเทศไทยอยู่ตรงไหน เป็น Page ที่รวบรวมและเปรียบเทียบสถิติต่าง ๆ ระหว่างประเทศไทยกับทั่วโลก เช่น คนไทยต้อง/ไม่ต้องขอวีซ่าเข้าประเทศไหนบ้าง (จาก Wikipedia) หรือดัชนีเสรีภาพสื่อ (จาก Freedom House)
ก็คงเป็นเรื่องที่คิดได้ไม่ยากว่า ถ้าจะเปรียบเทียบข้อมูลระหว่างประเทศต่าง ๆ ให้มองแวบเดียว (glance) แล้วพอเข้าใจนั้น แผนที่โลกก็น่าจะเป็นสื่อนำเสนอที่ดี เพราะคนอ่านก็คงพอจะทราบว่าประเทศไทยอยู่ตรงไหน ประเทศอื่น ๆ ที่ตนสนใจนั้นอยู่ตรงไหน
แล้วเราจะทำแผนที่เองได้อย่างไรบ้าง? Wikipedia มีแผนที่แม่แบบอยู่จำนวนหนึ่ง ซึ่งหลายชิ้น (ถ้าไม่ใช่ทั้งหมด) เป็นสาธารณสมบัติ (public domain) ซึ่งสามารถดาวน์โหลดมาแก้ไขด้วยซอฟต์แวร์ด้านรูปภาพ หรือใช้ชุดคำสั่งภาษา Pythonเพื่อความสะดวกในการใช้ข้อมูลที่มีอยู่แล้ว
นอกจากนี้ Google Chart API ก็มีชุดแผนที่แบบ Flash ให้นำไปแปะตามเว็บไซต์ สำหรับการนำเสนอข้อมูลที่มี “ลูกเล่น” มากกว่าภาพนิ่งทั่วไป
ลองทำแล้วส่งมาแบ่งกันดูบ้างนะครับ
วารสารศาสตร์เชิงคำนวณ: จะผลักข่าวไปข้างหน้า คอมพิวเตอร์ต้องเป็นมากกว่าเครื่องพิมพ์ดีด
หนึ่งในสาขาวิชาที่เพิ่งเกิดใหม่ทางด้านวารสารศาสตร์ ก็คือ computational journalism หรือขอแปลเอาเองว่า วารสารศาสตร์เชิงคำนวณ (ทำนองเดียวกับฟิสิกส์เชิงคำนวณ เคมีเชิงคำนวณ ภาษาศาสตร์เชิงคำนวณ ฯลฯ)
วิกิพีเดียอธิบายเกี่ยวกับสาขานี้ไว้ว่า:
วารสารศาสตร์เชิงคำนวณ สามารถนิยามได้ว่าเป็นการประยุกต์ใช้คอมพิวเตอร์เพื่อกิจกรรมทางวารสารศาสตร์ เช่น การรวบรวมข้อมูล การจัดระเบียบข้อมูล การทำความเข้าใจข้อมูล การสื่อสารและแพร่กระจายข้อมูลข่าวสาร โดยรักษาคุณค่าของวารสารศาสตร์ เช่น ความเป็นธรรม ความแม่นยำ และภววิสัย สาขาดังกล่าวได้ดึงเอาแง่มุมเทคนิคต่าง ๆ จากวิทยาศาสตร์คอมพิวเตอร์ ซึ่งรวมถึงปัญญาประดิษฐ์, การวิเคราะห์เนื้อหา (การประมวลผลภาษาธรรมชาติ, คอมพิวเตอร์วิทัศน์, การได้ยิน), การสร้างภาพ, การทำให้เป็นลักษณะส่วนบุคคล, และระบบแนะนำ รวมไปถึงแง่มุมจากการใช้คอมพิวเตอร์เชิงสังคมและสารสนเทศศาสตร์
ในขณะที่เว็บไซต์ Computation + Journalism ได้พูดถึงเป้าหมายของวารสารศาสตร์เชิงคำนวณไว้ว่า:
[วารสารศาสตร์เชิงคำนวณ] มองหาวิธีใหม่ ๆ ที่จะบรรลุเป้าหมายพื้นฐานของวารสารศาสตร์ ซึ่งตั้งใจจะจัดหาข้อมูลที่ถูกต้องให้กับพลเมือง เพื่อการมีส่วนร่วมและความสัมพันธ์กันของภาคพลเมือง เป้าหมายของเราในสาขาวารสารศาสตร์เชิงคำนวณนี้ คือการศึกษาความสนใจที่ทับซ้อนกันระหว่างการคำนวณและวารสารศาสตร์ เพื่อค้นหาว่าทั้งสองสิ่งนี้จะช่วยเราอย่างไร ในการรวบรวมสารสนเทศและการแพร่กระจายสารสนเทศ เพื่อและโดยพลเมือง ในการที่จะบรรลุความเป็นพลเมืองที่มีส่วนร่วมมากขึ้นและมีพลังมากขึ้น
ศูนย์เดอวิตต์ วอลเลซ เพื่อสื่อและประชาธิปไตย (DeWitt Wallace Center For Media & Democracy) ที่วิทยาลัยนโยบายสาธารณะ มหาวิทยาลัยดุ๊ก อธิบายความเป็นมาของสาขาและสิ่งที่วารสารศาสตร์เชิงคำนวณทำ ผ่านการพูดถึงงานชิ้นสำคัญ ๆ ของสาขา เช่น รายงานที่ใช้ชื่อว่า “พันธะความรับผิดชอบผ่านทางอัลกอริธึม: การพัฒนาสาขาวารสารศาสตร์เชิงคำนวณ” (Accountability Through Algorithm: Developing the Field of Computational Journalism) ซึ่งเป็นรายงานจากการแลกเปลี่ยนในการอบรมเชิงปฏิบัติการที่ศูนย์เพื่อการศึกษาขั้นสูงทางพฤติกรรมศาสตร์ (Center for Advanced Study in the Behavioral Sciences – CASBS) มหาวิทยาลัยสแตนฟอร์ด เมื่อปี 2009
ในรายงานขนาด 20 หน้า ฉบับดังกล่าว แบ่งเป็น 5 ส่วน ดังนี้
- Overview พูดถึงภาพกว้างโดยรวมของสาขา
- What Could Computational Journalism Look Like? หน้าตาของวารสารศาสตร์เชิงคำนวณจะเป็นอย่างไร เอามาทำอะไรได้บ้าง แบ่งเป็น 4 ส่วนย่อย คือเรื่อง 1) การสกัด ผสาน และสร้างภาพข้อมูล 2) เครื่องมือช่วยทำงานและติดตามข่าวสารของนักข่าว 3) การสร้างปฏิสัมพันธ์ระหว่างผู้อ่านและผู้สื่อข่าว 4) การไปช่วยทำความเข้าใจข่าวสาร ในสาขาอื่น ๆ (เช่น มนุษยศาสตร์ดิจิทัล, รัฐศาสตร์, เวชสารสนเทศศาสตร์)
- Some Likely Effects of Computational Journalism คาดการณ์ผลกระทบที่อาจเกิดจากวารสารศาสตร์เชิงคำนวณ เช่น คอมจะไม่แทนที่คน, จะมีผู้เล่นหน้าใหม่ ๆ ในงานข่าวจับตาสถานการณ์ (watchdog), ข้อมูลดิบจะถูกเปิดเผยกับผู้อ่าน เพื่อเพิ่มความโปร่งใส
- How Is The Field of Computational Journalism Evolving? Why Does This Matter? สาขานี้กำลังไปทางไหนกัน โดยดูจากกรณีศึกษาต่าง ๆ เช่น หนังสือพิมพ์เดอะการ์เดียน, เว็บไซต์โครงการแผนฟื้นฟูเศรษฐกิจของสหรัฐ Recovery.org, ความเคลื่อนไหวเปลี่ยนแปลงในการเปิดเผยข้อมูลภาครัฐทั้งในระดับประเทศและระดับท้องถิ่น
- Next Steps จะทำอะไรกันต่อได้บ้างต่อไป เพื่อผลักดันเป้าหมายของวารสารศาสตร์เชิงคำนวณ ที่ต้องการสร้างหนทางใหม่ ๆ ในการจะนำส่งข้อมูลข่าวสารที่ดีขึ้นสะดวกขึ้นสำหรับพลเมือง โดยแจกแจงผู้เล่นที่เป็นไปได้ และแนะนำบทบาทของผู้เล่นเหล่านั้น ซึ่งมีทั้งแหล่งทุน หน่วยงานภาครัฐ องค์กรพัฒนาเอกชน ศูนย์วิจัยในมหาวิทยาลัย ผู้อ่าน นักข่าว นักพัฒนาซอฟต์แวร์โอเพนซอร์ส
เพื่อจะให้เห็นภาพว่า หน้าตาเครื่องมืออะไรที่ว่า มันสามารถเป็นอะไรได้บ้าง หนึ่งในเว็บไซต์ที่มักถูกยกเป็นตัวอย่าง ก็คือ DocumentCloud ซึ่งเป็นเครื่องมือที่ช่วยในการทำความเข้าใจกับเอกสารที่จะกลายเป็นแหล่งข่าวได้
ผู้ใช้สามารถอัปโหลดเอกสารขึ้นไปที่เว็บ DocumentCloud จากนั้นมันจะถูกประมวลผลเพื่อค้นหาคำสำคัญ ชื่อบุคคล ผลิตภัณฑ์ องค์กร สถานที่ วันเวลา ฯลฯ จะถูกไฮไลต์โดยอัตโนมัติ เพื่อให้สังเกตเห็นง่าย (ใช้ API ของ OpenCalais ซึ่งพัฒนาโดยบริษัท ทอมสัน รอยเตอร์) จากนั้นผู้ใช้สามารถทำหมายเหตุประกอบเอกสาร (annotation) ได้ เพื่อเน้นส่วนที่สำคัญ ที่น่าสนใจ หรือใส่คำอธิบายว่าเนื้อความส่วนไหนน่าจะหมายถึงอะไร และสามารถแชร์เอกสารนี้กับคนอื่น ๆ เพื่อทำงานสืบสวนจากเอกสารร่วมกันได้ (อีกเครื่องมือหนึ่งที่เป็นแนวข่าวสืบสวนก็คือ Help Me Investigate ซึ่งเปิดให้ทุกคนร่วมกันสืบสวนประเด็นสาธารณะร่วมกันได้ ผ่านการช่วยกันตั้งคำถาม)
รายงานข่าวบริการสาธารณะ และรายงานข่าวระดับชาติ ที่ได้รับรางวัลพูลิตเซอร์ประจำปี 2011 นี้ ทั้งสองชิ้น ใช้ DocumentCloud ในการทำงาน (ชิ้นแรกโดย LA Times ชิ้นหลังโดย ProPublica)
สำหรับผู้สนใจว่า และมันมีสาขาอะไรบ้างหรือ ที่เข้ามาผสมข้ามไปข้ามมาในสหวิทยาการวารสารศาสตร์เชิงคำนวณ โจนาธาน สเตรย์ ได้ทำ A Computational Journalsim Reading List แนะนำสาขาที่เกี่ยวข้องและงานชิ้นสำคัญในสาขานั้น ๆ เอาไว้ โดยแบ่งเป็นหมวด วารสารศาสตร์ข้อมูล, การสร้างภาพข้อมูล, ภาษาศาสตร์เชิงคำนวณ, เทคโนโลยีการสื่อสารและการเข้ารหัส, การติดตามการกระจายของข่าวสาร, การคัดกรองและการแนะนำเนื้อหา, การวัดความรู้ของสาธารณะ, และสุดท้ายคือ การตั้งวาระการวิจัย
คณะหรือสาขาวิชานิเทศศาสตร์ วารสารศาสตร์ วิทยการคอมพิวเตอร์ วิศวกรรมคอมพิวเตอร์ บรรณารักษศาสตร์และสารนิเทศศาสตร์ รวมไปถึง ภาษาศาสตร์ รัฐศาสตร์ ที่ไหนในมหาวิทยาลัยเมืองไทย สนใจจะทำอะไรแนว ๆ นี้ ก็น่าจะลองจับมือกันดูข้ามคณะข้ามสาขา (หรือข้ามมหาลัยไปเลย) แอพพลิเคชันและเป้าหมายของงานก็มีอยู่ชัดเจน น่าจะลองเล่นกันดูหน่อย
จบแค่นี้ล่ะครับ
O’Reilly Radar: ความสำคัญที่เพิ่มมากขึ้นของวารสารศาสตร์ข้อมูล
แปลจาก The growing importance of data journalism โดย Alex Howard (@digiphile) 21 ธันวาคม 2553
การวิเคราะห์จำแนกความก้าวหน้าของข้อมูลภาครัฐ จำเป็นต้องใช้เครื่องมือใหม่ ๆ และแหล่งข้อมูลที่ไว้ใจได้
หนึ่งในประเด็นหลักจากงาน News Foo ที่ยังคงดังก้องอยู่ในหัวผมก็คือ ความสำคัญของวารสารศาสตร์ข้อมูล ความชำนิชำนาญในเรื่องดังกล่าวได้รับความสนใจอีกครั้งในฤดูหนาวนี้ เมื่อ ทิม เบอร์เนิร์ส-ลี [ผู้คิดค้นเวิลด์ไวด์เว็บ] ระบุว่าความสามารถในการวิเคราะห์ข้อมูลคืออนาคตของวารสารศาสตร์
เมื่อคุณมองไปที่วารสารศาสตร์ข้อมูลกับภาพใหญ่ เหมือนกับที่ แอนโธนี เดอบาร์รอส แห่งหนังสือพิมพ์ยูเอสเอทูเดย์ ได้ทำและเขียนในบล็อกของเขาเมื่อเดือนพฤศจิกายนที่ผ่านมา มันชัดเจนว่าเทคโนโลยีต่าง ๆ ในขณะนี้ เป็นพัฒนาการของการเล่าเรื่องที่ถูกยกระดับขึ้นด้วยเทคโนโลยี ซึ่งสืบย้อนไปได้ถึงการใช้คอมพิวเตอร์ช่วยในการรายงานข่าว (computer-assisted reporting – CAR).
เหมือนกับที่เดอบาร์รอสชี้ให้เราเห็น สิ่งที่ CAR ต้องการจะบอก “นั้นเกี่ยวกับการค้นหาเรื่องราว และใช้เครื่องมือง่าย ๆ เพื่อทำมัน: ตารางคำนวณ, ฐานข้อมูล, แผนที่, สถิติ” เช่น ไมโครซอฟท์แอคเซส, เอกซ์เซล, SPSS, และเอสคิวแอล เซิร์ฟเวอร์
สิ่งเหล่านั้นยังคงเป็นจริงอยู่ในปัจจุบัน แม้นักวารสารข้อมูลในตอนนี้จะมีเครื่องมือใหม่ ๆ ที่ทรงพลังสำหรับการเก็บเล็กผสมน้อยข้อมูลจากเว็บ ด้วยเครื่องมืออย่าง ScraperWiki และ Needlebase, เขียนโปรแกรมสคริปต์ด้วย Perl, หรือ Ruby, Python, MySQL และ Django
การทำความเข้าใจกับประวัติศาสตร์ของการใช้คอมพิวเตอร์ช่วยในการรายงานข่าว เป็นกุญแจสำคัญที่จะวางเครื่องมือใหม่ ๆ เหล่านี้ ลงไปในบริบทที่เหมาะสม “เราใช้เครื่องมือเหล่านี้เพื่อค้นหาและเล่าเรื่อง” เดอบาร์รอสเขียน “เราใช้มันเหมือนที่เราใช้โทรศัพท์ เรื่องราวยังคงเป็นสิ่งสำคัญสิ่งเดียว”
การประชุมเรื่องวารสารศาสตร์ข้อมูลที่งาน News Foo นั้น มีขึ้นในวันเดียวกับที่นักพัฒนาพลเมืองได้เข้าร่วมในมหกรรม “open data hackathon” ซึ่งมีขึ้นทั่วโลก [รวมถึงประเทศไทย] และหนังสือพิมพ์นิวยอร์กไทมส์ได้เป็นเจ้าภาพจัดงาน Times Open Hack Day นักพัฒนาจำนวนมากในการประกวดลักษณะนี้ มีความสนใจที่จะทำงานกับข้อมูลแบบเปิด แต่บทสนทนาที่ News Foo ก็ได้แสดงให้เห็นว่า หน่วยงานรัฐบาลยังคงต้องทำงานอีกมากแค่ไหน เพื่อที่จะทำสัญญาที่จะเปิดเผยข้อมูลที่รัฐบาลเก็บเอาไว้เพื่ออนาคตของวารสารศาสตร์ ให้กลายเป็นจริง
ประเด็นปัญหาที่พบนั้นสำคัญอย่างมาก ข้อมูลภาครัฐนั้นมักจะ “สกปรก” ไปด้วยช่องข้อมูลที่ผิดพลาดหรือไม่มีเมตาดาตา
นักข่าวจำเป็นต้องตรวจเช็คความถูกต้องและทำความสะอาดชุดข้อมูล ด้วยเครื่องมือเช่น Google Refine โครงการ Recovery Tracker ของเว็บไซต์ข่าว ProPublica ซึ่งช่วยติดตามข้อมูลงบประมาณและแผนกระตุ้นเศรษฐกิของสหรัฐ เป็นหนึ่งในตัวอย่างที่ดีที่สุดของการปฏิบัติการดังกล่าวในชีวิตจริง [ProPublica ดึงข้อมูลมาจากเว็บไซต์ Recovery.gov ของรัฐบาล ทำความสะอาดข้อมูล และเพิ่มเติมข้อมูลที่ขาดหายไป เพื่อให้ชุดข้อมูลนำไปใช้ได้จริง]
มาตรฐานอันสูงสุดเมื่อเร็ว ๆ นี้สำหรับวารสารศาสตร์ข้อมูล ก็คือโครงการ Toxic Waters จากนิวยอร์กไทมส์ ซึ่งชนะรางวัลพูลิตเซอร์ ขนาดของโครงการดังกล่าวทำให้มันยากที่จะติดตาม อย่างไรก็ตามนักพัฒนาของไทมส์ก็ยังทำงานอย่างหนักกับโครงการเจ๋ง ๆ อย่าง Inside Congress
คุณสามารถดูการสร้างภาพข้อมูลจากโครงการ Toxic Waters และตัวอย่างอื่น ๆ ของวารสารศาสตร์ข้อมูล ได้จากการนำเสนอในแบบ Ignite จากงาน News Foo
ที่ ProPublica ทีมวารสารศาสตร์ข้อมูลนั้นตระหนักถึงการเชื่อมโยงระดับลึกลงไปสู่แอพพลิเคชั่นข่าว ด้วยทัศนะที่ว่าภาพข้อมูลที่ถูกสร้างขึ้นจากแอพพลิเคชั่นเหล่านั้น ในตัวของพวกมันเองก็เป็นรูปแบบหนึ่งของการเสนอข่าวแบบพรรณนา ด้วยการวาดภาพข้อมูลที่เยี่ยมยอด ผู้อ่านสามารถค้นพบหนทางและซักไซ้ไล่เรียงข้อมูลดังกล่าวได้ด้วยตัวของพวกเขาเอง มากไปกว่านั้น ความแตกต่างระหว่าง “เรื่อง” ข่าว และ “แอพ” ข่าว ก็จะค่อย ๆ สลายไป เมื่อผู้อ่านรับข่าวสารมากขึ้น ๆ จากอุปกรณ์เคลื่อนที่และแท็บเล็ต
วิธีหนึ่งในการมอบบริบทที่เป็นประโยชน์แก่ผู้อ่าน ก็คือรูปแบบ “ไอออน” (ion) ที่เว็บไซต์ข่าว ProPublica.org ทำอยู่ โครงการอย่าง “Eye on the Stimulus” เป็นลูกผสมระหว่างบล็อกและแอพพลิเคชั่น ในด้านหนึ่งของหน้าเว็บดังกล่าว มันเป็นสายธารของข่าวที่ไหลอยู่ตลอดเวลา ในอีกด้านหนึ่ง มันมีจุดเข้าไปสู่ข้อมูลต่าง ๆ ความท้าทายของวิธีการนี้ก็คือ ช่องทางเสนอสื่อจะต้องมีการจัดขบวนระหว่างทีมงานและเรื่องราว นักข่าวจำเป็นต้องปรับข้อมูลทุกวัน สำหรับข่าวที่กำลังมีความเคลื่อนไหวอยู่ตลอดซึ่งอ่อนไหวต่อข้อมูล
อัปเกรด Data.gov
ช่วงการประชุมวารสารศาสตร์ข้อมูลในงาน News Foo มีองค์ประกอบที่เป็นแก่นอย่างหนึ่งคือ มันได้นำผู้ก่อตั้ง City Camp เควิน เคอร์รี่, ผู้เผยแพร่แนวคิด Data.gov จีน โฮล์ม, และผู้ได้รับทุนมูลนิธิเรย์โนลด์ส เดวิด แฮร์ซอก พร้อมกับผู้เข้าร่วมงาน News Foo ให้ได้พูดคุยเกี่ยวกับการให้คุณค่าของ ข้อมูลภาครัฐแบบเปิด และ วารสารศาสตร์ข้อมูล
ดังที่รายงานการศึกษาข้อมูลแบบเปิดฉบับล่าสุดได้แสดง นักพัฒนานั้นไม่พบข้อมูลภาครัฐที่ตัวเองจำเป็นต้องใช้หรือต้องการจะใช้ ถ้ามีผู้ประกอบการรายอื่น ๆ ต้องการเดินตามรอยของ BrightScope ชุดข้อมูลแบบเปิดของภาครัฐจะต้องเชื่อมโยงเกี่ยวข้องให้มากขึ้นกับธุรกิจ เสียงตอบรับสำหรับ Data.gov และคลังข้อมูลภาครัฐอื่น ๆ นั้นชัดเจน: ข้อมูลที่มากขึ้น ข้อมูลที่ดีขึ้น และข้อมูลที่สะอาดขึ้น กรุณาด้วย
การพัฒนาให้สื่อเข้าถึงข้อมูลได้ดีขึ้น ในระดับรัฐบาลเขตหรือรัฐบาลมลรัฐ นั้นมีอุปสรรคเชิงโครงสร้าง เนื่องจากวิกฤตงบประมาณที่ขยายตัวมากขึ้นในหน่วยงานรัฐทั่วสหรัฐอเมริกา ดังเช่นที่ จีน โฮล์ม ได้สังเกตเห็นระหว่างการประชุม News Foo โครงการริเริ่มด้านรัฐบาลเปิดนั้นมีแนวโน้มจะถูกดำเนินการในสภาพแวดล้อมที่ใช้งบประมาณแบบผลรวมเป็นศูนย์ในปี 2554 เจ้าหน้าที่รัฐต่าง ๆ จำเป็นต้องทำให้โครงการของตัวเองยั่งยืนและเลี้ยงตัวเองได้
มันมีบางเรื่องที่รัฐบาลสหพันธ์สามารถจะช่วยได้ โฮล์มบอกว่า Data.gov ได้สร้างโฮสต์คอมพิวเตอร์แบบกลุ่มเมฆ (cloud) ซึ่งสามารถจะแบ่งใช้กับรัฐบาลมลรัฐ รัฐบาลท้องถิ่น และรัฐบาลชุมชน Data.gov ยังได้ออกชุดเครื่องมือที่จะช่วยในการแปลงข้อมูล แปลงภาพอักษรเป็นข้อความ (โอซีอาร์) และในอนาคตจะมีเครื่องมือที่ดีขึ้นสำหรับข้อมูลแบบมีโครงสร้าง
ทรัพยากรดังกล่าวเหล่านั้น จะสามารถทำให้ข้อมูลภาครัฐมีพร้อมใช้มากขึ้นและเข้าถึงได้มากขึ้นสำหรับสื่อ เควิน เคอร์รี่ กล่าวว่าบัญชีข้อมูลนั้นเกิดขึ้นใหม่ในทุกที่ [ของประเทศไทย] เขาชี้ไปที่ CivicApps ในพอร์ตแลนด์ โอเรกอน ที่ซึ่งงานที่ แมกซ์ อ็อกเดน ได้ทำกับการเขียนโค้ดซอฟต์แวร์มิดเดิลแวร์สำหรับรัฐบาลแบบเปิด ได้นำไปสู่การแปลงข้อมูลภาครัฐไปสู่รูปแบบที่เป็นประโยชน์มากกว่าสำหรับนักพัฒนา
นักวารสารข้อมูลยังประสบกับความท้าทายทางวัฒนธรรมของภาครัฐ มันเป็นเรื่องยากที่จะพบเจ้าหน้าที่สารสนเทศภาครัฐที่มีความปราถนาหรือมีความสามารถที่จะถามคำถามสำคัญ ๆ เกี่ยวกับข้อมูล โฮล์มบอกว่า Data.gov อาจจะประกาศข้อมูลติดต่อให้มากขึ้นออนไลน์ และสร้างบทสนทนาให้มากขึ้นรอบ ๆ ชุดข้อมูลแต่ละชุด ข้อมูลลักษณะดังกล่าวเป็นจุดเริ่มต้นที่ดีสำหรับการค้นหาข้อกังวลเกี่ยวกับข้อมูลในระดับสหพันธ์ อย่างไรก็ตาม การสนับสนุนความสัมพันธ์ที่เป็นประโยชน์ระหว่างนักข่าวและข้อมูลยังต้องการความพยายามและการพัฒนาให้ดีขึ้นไปอีก
ข่าวที่เกี่ยวข้องจาก O’Reilly Radar:

