วารสารศาสตร์ข้อมูล – Data Journalism

เปลี่ยนข้อมูลให้เป็นข่าว

Archive for the ‘tools’ Category

ใช้ Google Refine ทำความสะอาดข้อมูล

without comments

Google Refine เป็นเครื่องมือสำหรับทำความสะอาดข้อมูล เช่น รวมกลุ่มข้อมูลที่ชื่อหมวดอาจจะสะกดต่างกันเล็ก ๆ น้อย ๆ (เช่น มีช่องว่าง ใช้ตัวย่อ ตัวไม่ย่อ) ให้มาเป็นหมวดเดียวกัน, มองหาข้อมูลที่อาจจะผิดพลาด หรืออยู่ในหน่วยนับอื่น เพื่อให้สุดท้ายแล้ว เรามีข้อมูลที่นำไปประมวลผลได้ง่ายขึ้น มองเห็นภาพใหญ่ได้มากขึ้น

Google Refine ทำงานบนเครื่องคอมของเราเอง ผ่านหน้าจอเบราว์เซอร์ โดยไม่ได้อัปโหลดข้อมูลของเรา ซึ่งอาจจะอ่อนไหว ไปที่เซิร์ฟเวอร์ไหน

Written by bact'

July 6th, 2011 at 6:13 pm

Posted in tools

Tagged with ,

“ประเทศไทยอยู่ตรงไหน” – การเปรียบเทียบข้อมูลด้วยแผนที่

with 2 comments

เมื่อไม่นานมานี้ไปเจอ Facebook Page อันนึงที่น่าสนใจมาก ชื่อว่า ประเทศไทยอยู่ตรงไหน เป็น Page ที่รวบรวมและเปรียบเทียบสถิติต่าง ๆ ระหว่างประเทศไทยกับทั่วโลก เช่น คนไทยต้อง/ไม่ต้องขอวีซ่าเข้าประเทศไหนบ้าง (จาก Wikipedia) หรือดัชนีเสรีภาพสื่อ (จาก Freedom House)

ก็คงเป็นเรื่องที่คิดได้ไม่ยากว่า ถ้าจะเปรียบเทียบข้อมูลระหว่างประเทศต่าง ๆ ให้มองแวบเดียว (glance) แล้วพอเข้าใจนั้น แผนที่โลกก็น่าจะเป็นสื่อนำเสนอที่ดี เพราะคนอ่านก็คงพอจะทราบว่าประเทศไทยอยู่ตรงไหน ประเทศอื่น ๆ ที่ตนสนใจนั้นอยู่ตรงไหน

แล้วเราจะทำแผนที่เองได้อย่างไรบ้าง? Wikipedia มีแผนที่แม่แบบอยู่จำนวนหนึ่ง ซึ่งหลายชิ้น (ถ้าไม่ใช่ทั้งหมด) เป็นสาธารณสมบัติ (public domain) ซึ่งสามารถดาวน์โหลดมาแก้ไขด้วยซอฟต์แวร์ด้านรูปภาพ หรือใช้ชุดคำสั่งภาษา Pythonเพื่อความสะดวกในการใช้ข้อมูลที่มีอยู่แล้ว

นอกจากนี้ Google Chart API ก็มีชุดแผนที่แบบ Flash ให้นำไปแปะตามเว็บไซต์ สำหรับการนำเสนอข้อมูลที่มี “ลูกเล่น” มากกว่าภาพนิ่งทั่วไป

ลองทำแล้วส่งมาแบ่งกันดูบ้างนะครับ

Written by tewson

June 5th, 2011 at 9:34 pm

Posted in data visualization,tools

Tagged with

วารสารศาสตร์เชิงคำนวณ: จะผลักข่าวไปข้างหน้า คอมพิวเตอร์ต้องเป็นมากกว่าเครื่องพิมพ์ดีด

with 3 comments

Adrian Holovaty om Everyblock.com - Han setter journalistikken på kartet

หนึ่งในสาขาวิชาที่เพิ่งเกิดใหม่ทางด้านวารสารศาสตร์ ก็คือ computational journalism หรือขอแปลเอาเองว่า วารสารศาสตร์เชิงคำนวณ (ทำนองเดียวกับฟิสิกส์เชิงคำนวณ เคมีเชิงคำนวณ ภาษาศาสตร์เชิงคำนวณ ฯลฯ)

วิกิพีเดียอธิบายเกี่ยวกับสาขานี้ไว้ว่า:

วารสารศาสตร​์เชิงคำนวณ สามารถนิยามได้ว่าเป็นการประยุกต์ใช้คอมพิวเตอร์เพื่อกิจกรรมทางวารสารศาสตร์ เช่น การรวบรวมข้อมูล การจัดระเบียบข้อมูล การทำความเข้าใจข้อมูล การสื่อสารและแพร่กระจายข้อมูลข่าวสาร โดยรักษาคุณค่าของวารสารศาสตร์ เช่น ความเป็นธรรม ความแม่นยำ และภววิสัย สาขาดังกล่าวได้ดึงเอาแง่มุมเทคนิคต่าง ๆ จากวิทยาศาสตร์คอมพิวเตอร์ ซึ่งรวมถึงปัญญาประดิษฐ์, การวิเคราะห์เนื้อหา (การประมวลผลภาษาธรรมชาติ, คอมพิวเตอร์วิทัศน์, การได้ยิน), การสร้างภาพ, การทำให้เป็นลักษณะส่วนบุคคล, และระบบแนะนำ รวมไปถึงแง่มุมจากการใช้คอมพิวเตอร์เชิงสังคมและสารสนเทศศาสตร์

ในขณะที่เว็บไซต์ Computation + Journalism ได้พูดถึงเป้าหมายของวารสารศาสตร์เชิงคำนวณไว้ว่า:

[วารสารศาสตร์เชิงคำนวณ] มองหาวิธีใหม่ ๆ ที่จะบรรลุเป้าหมายพื้นฐานของวารสารศาสตร์ ซึ่งตั้งใจจะจัดหาข้อมูลที่ถูกต้องให้กับพลเมือง เพื่อการมีส่วนร่วมและความสัมพันธ์กันของภาคพลเมือง เป้าหมายของเราในสาขาวารสารศาสตร์เชิงคำนวณนี้ คือการศึกษาความสนใจที่ทับซ้อนกันระหว่างการคำนวณและวารสารศาสตร์ เพื่อค้นหาว่าทั้งสองสิ่งนี้จะช่วยเราอย่างไร ในการรวบรวมสารสนเทศและการแพร่กระจายสารสนเทศ เพื่อและโดยพลเมือง ในการที่จะบรรลุความเป็นพลเมืองที่มีส่วนร่วมมากขึ้นและมีพลังมากขึ้น

ศูนย์เดอวิตต์ วอลเลซ เพื่อสื่อและประชาธิปไตย (DeWitt Wallace Center For Media & Democracy) ที่วิทยาลัยนโยบายสาธารณะ มหาวิทยาลัยดุ๊ก อธิบายความเป็นมาของสาขาและสิ่งที่วารสารศาสตร์เชิงคำนวณทำ ผ่านการพูดถึงงานชิ้นสำคัญ ๆ ของสาขา เช่น รายงานที่ใช้ชื่อว่า “พันธะความรับผิดชอบผ่านทางอัลกอริธึม: การพัฒนาสาขาวารสารศาสตร์เชิงคำนวณ” (Accountability Through Algorithm: Developing the Field of Computational Journalism) ซึ่งเป็นรายงานจากการแลกเปลี่ยนในการอบรมเชิงปฏิบัติการที่ศูนย์เพื่อการศึกษาขั้นสูงทางพฤติกรรมศาสตร์ (Center for Advanced Study in the Behavioral Sciences – CASBS) มหาวิทยาลัยสแตนฟอร์ด เมื่อปี 2009

ในรายงานขนาด 20 หน้า ฉบับดังกล่าว แบ่งเป็น 5 ส่วน ดังนี้

  1. Overview พูดถึงภาพกว้างโดยรวมของสาขา
  2. What Could Computational Journalism Look Like? หน้าตาของวารสารศาสตร์เชิงคำนวณจะเป็นอย่างไร เอามาทำอะไรได้บ้าง แบ่งเป็น 4 ส่วนย่อย คือเรื่อง 1) การสกัด ผสาน และสร้างภาพข้อมูล 2) เครื่องมือช่วยทำงานและติดตามข่าวสารของนักข่าว 3) การสร้างปฏิสัมพันธ์ระหว่างผู้อ่านและผู้สื่อข่าว 4) การไปช่วยทำความเข้าใจข่าวสาร ในสาขาอื่น ๆ (เช่น มนุษยศาสตร์ดิจิทัล, รัฐศาสตร์, เวชสารสนเทศศาสตร์)
  3. Some Likely Effects of Computational Journalism คาดการณ์ผลกระทบที่อาจเกิดจากวารสารศาสตร์เชิงคำนวณ เช่น คอมจะไม่แทนที่คน, จะมีผู้เล่นหน้าใหม่ ๆ ในงานข่าวจับตาสถานการณ์ (watchdog), ข้อมูลดิบจะถูกเปิดเผยกับผู้อ่าน เพื่อเพิ่มความโปร่งใส
  4. How Is The Field of Computational Journalism Evolving? Why Does This Matter? สาขานี้กำลังไปทางไหนกัน โดยดูจากกรณีศึกษาต่าง ๆ เช่น หนังสือพิมพ์เดอะการ์เดียน, เว็บไซต์โครงการแผนฟื้นฟูเศรษฐกิจของสหรัฐ Recovery.org, ความเคลื่อนไหวเปลี่ยนแปลงในการเปิดเผยข้อมูลภาครัฐทั้งในระดับประเทศและระดับท้องถิ่น
  5. Next Steps จะทำอะไรกันต่อได้บ้างต่อไป เพื่อผลักดันเป้าหมายของวารสารศาสตร์เชิงคำนวณ ที่ต้องการสร้างหนทางใหม่ ๆ ในการจะนำส่งข้อมูลข่าวสารที่ดีขึ้นสะดวกขึ้นสำหรับพลเมือง โดยแจกแจงผู้เล่นที่เป็นไปได้ และแนะนำบทบาทของผู้เล่นเหล่านั้น ซึ่งมีทั้งแหล่งทุน หน่วยงานภาครัฐ องค์กรพัฒนาเอกชน ศูนย์วิจัยในมหาวิทยาลัย ผู้อ่าน นักข่าว นักพัฒนาซอฟต์แวร์โอเพนซอร์ส

เพื่อจะให้เห็นภาพว่า หน้าตาเครื่องมืออะไรที่ว่า มันสามารถเป็นอะไรได้บ้าง หนึ่งในเว็บไซต์ที่มักถูกยกเป็นตัวอย่าง ก็คือ DocumentCloud ซึ่งเป็นเครื่องมือที่ช่วยในการทำความเข้าใจกับเอกสารที่จะกลายเป็นแหล่งข่าวได้

หมายเหตุประกอบใบแจ้งราคาสินค้า Invoices for Subcontractor Core 4 KEBAWK Group LLC

ความผิดปกติที่พบในใบแจ้งราคาสินค้า ถูกทำเครื่องหมายไว้ใน DocumentCloud

ผู้ใช้สามารถอัปโหลดเอกสารขึ้นไปที่เว็บ DocumentCloud จากนั้นมันจะถูกประมวลผลเพื่อค้นหาคำสำคัญ ชื่อบุคคล ผลิตภัณฑ์ องค์กร สถานที่ วันเวลา ฯลฯ จะถูกไฮไลต์โดยอัตโนมัติ เพื่อให้สังเกตเห็นง่าย (ใช้ API ของ OpenCalais ซึ่งพัฒนาโดยบริษัท ทอมสัน รอยเตอร์) จากนั้นผู้ใช้สามารถทำหมายเหตุประกอบเอกสาร (annotation) ได้ เพื่อเน้นส่วนที่สำคัญ ที่น่าสนใจ หรือใส่คำอธิบายว่าเนื้อความส่วนไหนน่าจะหมายถึงอะไร และสามารถแชร์เอกสารนี้กับคนอื่น ๆ เพื่อทำงานสืบสวนจากเอกสารร่วมกันได้ (อีกเครื่องมือหนึ่งที่เป็นแนวข่าวสืบสวนก็คือ Help Me Investigate ซึ่งเปิดให้ทุกคนร่วมกันสืบสวนประเด็นสาธารณะร่วมกันได้ ผ่านการช่วยกันตั้งคำถาม)

รายงานข่าวบริการสาธารณะ และรายงานข่าวระดับชาติ ที่ได้รับรางวัลพูลิตเซอร์ประจำปี 2011 นี้ ทั้งสองชิ้น ใช้ DocumentCloud ในการทำงาน (ชิ้นแรกโดย LA Times ชิ้นหลังโดย ProPublica)

สำหรับผู้สนใจว่า และมันมีสาขาอะไรบ้างหรือ ที่เข้ามาผสมข้ามไปข้ามมาในสหวิทยาการวารสารศาสตร์เชิงคำนวณ โจนาธาน สเตรย์ ได้ทำ A Computational Journalsim Reading List แนะนำสาขาที่เกี่ยวข้องและงานชิ้นสำคัญในสาขานั้น ๆ เอาไว้ โดยแบ่งเป็นหมวด วารสารศาสตร์ข้อมูล, การสร้างภาพข้อมูล, ภาษาศาสตร์เชิงคำนวณ, เทคโนโลยีการสื่อสารและการเข้ารหัส, การติดตามการกระจายของข่าวสาร, การคัดกรองและการแนะนำเนื้อหา, การวัดความรู้ของสาธารณะ, และสุดท้ายคือ การตั้งวาระการวิจัย

คณะหรือสาขาวิชานิเทศศาสตร์ วารสารศาสตร์ วิทยการคอมพิวเตอร์ วิศวกรรมคอมพิวเตอร์ บรรณารักษศาสตร์และสารนิเทศศาสตร์ รวมไปถึง ภาษาศาสตร์ รัฐศาสตร์ ที่ไหนในมหาวิทยาลัยเมืองไทย สนใจจะทำอะไรแนว ๆ นี้ ก็น่าจะลองจับมือกันดูข้ามคณะข้ามสาขา (หรือข้ามมหาลัยไปเลย) แอพพลิเคชันและเป้าหมายของงานก็มีอยู่ชัดเจน น่าจะลองเล่นกันดูหน่อย :)

จบแค่นี้ล่ะครับ

Written by bact'

April 26th, 2011 at 12:35 pm

O’Reilly Radar: ความสำคัญที่เพิ่มมากขึ้นของวารสารศาสตร์ข้อมูล

without comments

แปลจาก The growing importance of data journalism โดย Alex Howard (@digiphile) 21 ธันวาคม 2553

การวิเคราะห์จำแนกความก้าวหน้าของข้อมูลภาครัฐ จำเป็นต้องใช้เครื่องมือใหม่ ๆ และแหล่งข้อมูลที่ไว้ใจได้

หนึ่งในประเด็นหลักจากงาน News Foo ที่ยังคงดังก้องอยู่ในหัวผมก็คือ ความสำคัญของวารสารศาสตร์ข้อมูล ความชำนิชำนาญในเรื่องดังกล่าวได้รับความสนใจอีกครั้งในฤดูหนาวนี้ เมื่อ ทิม เบอร์เนิร์ส-ลี [ผู้คิดค้นเวิลด์ไวด์เว็บ] ระบุว่าความสามารถในการวิเคราะห์ข้อมูลคืออนาคตของวารสารศาสตร์

เมื่อคุณมองไปที่วารสารศาสตร์ข้อมูลกับภาพใหญ่ เหมือนกับที่ แอนโธนี เดอบาร์รอส แห่งหนังสือพิมพ์ยูเอสเอทูเดย์ ได้ทำและเขียนในบล็อกของเขาเมื่อเดือนพฤศจิกายนที่ผ่านมา มันชัดเจนว่าเทคโนโลยีต่าง ๆ ในขณะนี้ เป็นพัฒนาการของการเล่าเรื่องที่ถูกยกระดับขึ้นด้วยเทคโนโลยี ซึ่งสืบย้อนไปได้ถึงการใช้คอมพิวเตอร์ช่วยในการรายงานข่าว (computer-assisted reporting – CAR).

เหมือนกับที่เดอบาร์รอสชี้ให้เราเห็น สิ่งที่ CAR ต้องการจะบอก “นั้นเกี่ยวกับการค้นหาเรื่องราว และใช้เครื่องมือง่าย ๆ เพื่อทำมัน: ตารางคำนวณ, ฐานข้อมูล, แผนที่, สถิติ” เช่น ไมโครซอฟท์แอคเซส, เอกซ์เซล, SPSS, และเอสคิวแอล เซิร์ฟเวอร์
สิ่งเหล่านั้นยังคงเป็นจริงอยู่ในปัจจุบัน แม้นักวารสารข้อมูลในตอนนี้จะมีเครื่องมือใหม่ ๆ ที่ทรงพลังสำหรับการเก็บเล็กผสมน้อยข้อมูลจากเว็บ ด้วยเครื่องมืออย่าง ScraperWiki และ Needlebase, เขียนโปรแกรมสคริปต์ด้วย Perl, หรือ Ruby, Python, MySQL และ Django

การทำความเข้าใจกับประวัติศาสตร์ของการใช้คอมพิวเตอร์ช่วยในการรายงานข่าว เป็นกุญแจสำคัญที่จะวางเครื่องมือใหม่ ๆ เหล่านี้ ลงไปในบริบทที่เหมาะสม “เราใช้เครื่องมือเหล่านี้เพื่อค้นหาและเล่าเรื่อง” เดอบาร์รอสเขียน “เราใช้มันเหมือนที่เราใช้โทรศัพท์ เรื่องราวยังคงเป็นสิ่งสำคัญสิ่งเดียว”

การประชุมเรื่องวารสารศาสตร์ข้อมูลที่งาน News Foo นั้น มีขึ้นในวันเดียวกับที่นักพัฒนาพลเมืองได้เข้าร่วมในมหกรรม “open data hackathon” ซึ่งมีขึ้นทั่วโลก [รวมถึงประเทศไทย] และหนังสือพิมพ์นิวยอร์กไทมส์ได้เป็นเจ้าภาพจัดงาน Times Open Hack Day นักพัฒนาจำนวนมากในการประกวดลักษณะนี้ มีความสนใจที่จะทำงานกับข้อมูลแบบเปิด แต่บทสนทนาที่ News Foo ก็ได้แสดงให้เห็นว่า หน่วยงานรัฐบาลยังคงต้องทำงานอีกมากแค่ไหน เพื่อที่จะทำสัญญาที่จะเปิดเผยข้อมูลที่รัฐบาลเก็บเอาไว้เพื่ออนาคตของวารสารศาสตร์ ให้กลายเป็นจริง

ประเด็นปัญหาที่พบนั้นสำคัญอย่างมาก ข้อมูลภาครัฐนั้นมักจะ “สกปรก” ไปด้วยช่องข้อมูลที่ผิดพลาดหรือไม่มีเมตาดาตา
นักข่าวจำเป็นต้องตรวจเช็คความถูกต้องและทำความสะอาดชุดข้อมูล ด้วยเครื่องมือเช่น Google Refine โครงการ Recovery Tracker ของเว็บไซต์ข่าว ProPublica ซึ่งช่วยติดตามข้อมูลงบประมาณและแผนกระตุ้นเศรษฐกิของสหรัฐ เป็นหนึ่งในตัวอย่างที่ดีที่สุดของการปฏิบัติการดังกล่าวในชีวิตจริง [ProPublica ดึงข้อมูลมาจากเว็บไซต์ Recovery.gov ของรัฐบาล ทำความสะอาดข้อมูล และเพิ่มเติมข้อมูลที่ขาดหายไป เพื่อให้ชุดข้อมูลนำไปใช้ได้จริง]

มาตรฐานอันสูงสุดเมื่อเร็ว ๆ นี้สำหรับวารสารศาสตร์ข้อมูล ก็คือโครงการ Toxic Waters จากนิวยอร์กไทมส์ ซึ่งชนะรางวัลพูลิตเซอร์ ขนาดของโครงการดังกล่าวทำให้มันยากที่จะติดตาม อย่างไรก็ตามนักพัฒนาของไทมส์ก็ยังทำงานอย่างหนักกับโครงการเจ๋ง ๆ อย่าง Inside Congress

คุณสามารถดูการสร้างภาพข้อมูลจากโครงการ Toxic Waters และตัวอย่างอื่น ๆ ของวารสารศาสตร์ข้อมูล ได้จากการนำเสนอในแบบ Ignite จากงาน News Foo

ที่ ProPublica ทีมวารสารศาสตร์ข้อมูลนั้นตระหนักถึงการเชื่อมโยงระดับลึกลงไปสู่แอพพลิเคชั่นข่าว ด้วยทัศนะที่ว่าภาพข้อมูลที่ถูกสร้างขึ้นจากแอพพลิเคชั่นเหล่านั้น ในตัวของพวกมันเองก็เป็นรูปแบบหนึ่งของการเสนอข่าวแบบพรรณนา ด้วยการวาดภาพข้อมูลที่เยี่ยมยอด ผู้อ่านสามารถค้นพบหนทางและซักไซ้ไล่เรียงข้อมูลดังกล่าวได้ด้วยตัวของพวกเขาเอง มากไปกว่านั้น ความแตกต่างระหว่าง “เรื่อง” ข่าว และ “แอพ” ข่าว ก็จะค่อย ๆ สลายไป เมื่อผู้อ่านรับข่าวสารมากขึ้น ๆ จากอุปกรณ์เคลื่อนที่และแท็บเล็ต

วิธีหนึ่งในการมอบบริบทที่เป็นประโยชน์แก่ผู้อ่าน ก็คือรูปแบบ “ไอออน” (ion) ที่เว็บไซต์ข่าว ProPublica.org ทำอยู่ โครงการอย่าง “Eye on the Stimulus” เป็นลูกผสมระหว่างบล็อกและแอพพลิเคชั่น ในด้านหนึ่งของหน้าเว็บดังกล่าว มันเป็นสายธารของข่าวที่ไหลอยู่ตลอดเวลา ในอีกด้านหนึ่ง มันมีจุดเข้าไปสู่ข้อมูลต่าง ๆ ความท้าทายของวิธีการนี้ก็คือ ช่องทางเสนอสื่อจะต้องมีการจัดขบวนระหว่างทีมงานและเรื่องราว นักข่าวจำเป็นต้องปรับข้อมูลทุกวัน สำหรับข่าวที่กำลังมีความเคลื่อนไหวอยู่ตลอดซึ่งอ่อนไหวต่อข้อมูล

อัปเกรด Data.gov

ช่วงการประชุมวารสารศาสตร์ข้อมูลในงาน News Foo มีองค์ประกอบที่เป็นแก่นอย่างหนึ่งคือ มันได้นำผู้ก่อตั้ง City Camp เควิน เคอร์รี่, ผู้เผยแพร่แนวคิด Data.gov จีน โฮล์ม, และผู้ได้รับทุนมูลนิธิเรย์โนลด์ส เดวิด แฮร์ซอก พร้อมกับผู้เข้าร่วมงาน News Foo ให้ได้พูดคุยเกี่ยวกับการให้คุณค่าของ ข้อมูลภาครัฐแบบเปิด และ วารสารศาสตร์ข้อมูล

ดังที่รายงานการศึกษาข้อมูลแบบเปิดฉบับล่าสุดได้แสดง นักพัฒนานั้นไม่พบข้อมูลภาครัฐที่ตัวเองจำเป็นต้องใช้หรือต้องการจะใช้ ถ้ามีผู้ประกอบการรายอื่น ๆ ต้องการเดินตามรอยของ BrightScope ชุดข้อมูลแบบเปิดของภาครัฐจะต้องเชื่อมโยงเกี่ยวข้องให้มากขึ้นกับธุรกิจ เสียงตอบรับสำหรับ Data.gov และคลังข้อมูลภาครัฐอื่น ๆ นั้นชัดเจน: ข้อมูลที่มากขึ้น ข้อมูลที่ดีขึ้น และข้อมูลที่สะอาดขึ้น กรุณาด้วย

การพัฒนาให้สื่อเข้าถึงข้อมูลได้ดีขึ้น ในระดับรัฐบาลเขตหรือรัฐบาลมลรัฐ นั้นมีอุปสรรคเชิงโครงสร้าง เนื่องจากวิกฤตงบประมาณที่ขยายตัวมากขึ้นในหน่วยงานรัฐทั่วสหรัฐอเมริกา ดังเช่นที่ จีน โฮล์ม ได้สังเกตเห็นระหว่างการประชุม News Foo โครงการริเริ่มด้านรัฐบาลเปิดนั้นมีแนวโน้มจะถูกดำเนินการในสภาพแวดล้อมที่ใช้งบประมาณแบบผลรวมเป็นศูนย์ในปี 2554 เจ้าหน้าที่รัฐต่าง ๆ จำเป็นต้องทำให้โครงการของตัวเองยั่งยืนและเลี้ยงตัวเองได้

มันมีบางเรื่องที่รัฐบาลสหพันธ์สามารถจะช่วยได้ โฮล์มบอกว่า Data.gov ได้สร้างโฮสต์คอมพิวเตอร์แบบกลุ่มเมฆ (cloud) ซึ่งสามารถจะแบ่งใช้กับรัฐบาลมลรัฐ รัฐบาลท้องถิ่น และรัฐบาลชุมชน Data.gov ยังได้ออกชุดเครื่องมือที่จะช่วยในการแปลงข้อมูล แปลงภาพอักษรเป็นข้อความ (โอซีอาร์) และในอนาคตจะมีเครื่องมือที่ดีขึ้นสำหรับข้อมูลแบบมีโครงสร้าง

ทรัพยากรดังกล่าวเหล่านั้น จะสามารถทำให้ข้อมูลภาครัฐมีพร้อมใช้มากขึ้นและเข้าถึงได้มากขึ้นสำหรับสื่อ เควิน เคอร์รี่ กล่าวว่าบัญชีข้อมูลนั้นเกิดขึ้นใหม่ในทุกที่ [ของประเทศไทย] เขาชี้ไปที่ CivicApps ในพอร์ตแลนด์ โอเรกอน ที่ซึ่งงานที่ แมกซ์ อ็อกเดน ได้ทำกับการเขียนโค้ดซอฟต์แวร์มิดเดิลแวร์สำหรับรัฐบาลแบบเปิด ได้นำไปสู่การแปลงข้อมูลภาครัฐไปสู่รูปแบบที่เป็นประโยชน์มากกว่าสำหรับนักพัฒนา

นักวารสารข้อมูลยังประสบกับความท้าทายทางวัฒนธรรมของภาครัฐ มันเป็นเรื่องยากที่จะพบเจ้าหน้าที่สารสนเทศภาครัฐที่มีความปราถนาหรือมีความสามารถที่จะถามคำถามสำคัญ ๆ เกี่ยวกับข้อมูล โฮล์มบอกว่า Data.gov อาจจะประกาศข้อมูลติดต่อให้มากขึ้นออนไลน์ และสร้างบทสนทนาให้มากขึ้นรอบ ๆ ชุดข้อมูลแต่ละชุด ข้อมูลลักษณะดังกล่าวเป็นจุดเริ่มต้นที่ดีสำหรับการค้นหาข้อกังวลเกี่ยวกับข้อมูลในระดับสหพันธ์ อย่างไรก็ตาม การสนับสนุนความสัมพันธ์ที่เป็นประโยชน์ระหว่างนักข่าวและข้อมูลยังต้องการความพยายามและการพัฒนาให้ดีขึ้นไปอีก

ข่าวที่เกี่ยวข้องจาก O’Reilly Radar:

Written by bact'

April 24th, 2011 at 2:26 am