/ Data Science

ค้นหาชุดข้อมูล (Dataset) ผ่านเครื่องมือค้นหาของ Google

งานค้นคว้าวิจัยทางด้าน AI มีมากขึ้นเรื่อยๆ ความต้องการข้อมูลยิ่งมากขึ้น หลายหน่วยงานเริ่มปล่อยชุดข้อมูลให้บุคคลทั่วไปนำไปใช้ประโยชน์ Google เองก็ได้พัฒนาเครื่องมือสำหรับค้นหาชุดข้อมูลเหล่านี้ โดยทำดัชนี (Index) ชุดข้อมูลไว้มากกว่า 25 ล้านชุดแล้ว

เมื่อไม่กี่วันมานี้ (23 มกราคม 2020) Google เพิ่งปล่อยเครื่องมือตัวใหม่ที่กล่าวถึง สำหรับค้นหาชุดข้อมูลออกสู่สาธารณะ
https://datasetsearch.research.google.com/

เราสามารถจำกัดเงื่อนไขการค้นหาได้หลายรูปแบบ เช่น ค้นหาตามประเภทของข้อมูล (ตาราง รูป หรือข้อความ) ค้นหาตามลักษณะการใช้งาน (ใช้เพื่อการค้าได้ หรือใช้เฉพาะการศึกษา) และค้นหาตามความใหม่ของข้อมูล

ทั้งนี้ เจ้าของชุดข้อมูลที่ต้องการเผยแพร่ จำเป็นต้องกำหนดรูปแบบของชุดข้อมูลตามมาตรฐานกลางของ schema .org เพื่อให้เครื่องมือสามารถค้นหาและทำดัชนีได้อย่างถูกต้อง

สถิติข้อมูลที่น่าสนใจ

คำค้นหาที่คนใช้กันมากที่สุดคือ การศึกษา (education) สภาวะอากาศ (weather) มะเร็ง (cancer) อาชญากรรม (crime) ฟุตบอล (soccer) และ ………. สุนัข (dogs) !!

ประเภทของข้อมูลที่มีมากที่สุดคือ ธรณีศาสตร์ (geosciences) ชีววิทยา (biology) และการเกษตร (agriculture) โดยข้อมูลประเภทที่หาได้ง่ายที่สุดคือข้อมูลชนิดตาราง

ข้อมูลส่วนหนึ่งมาจากฝั่งรัฐบาล โดยสหรัฐอเมริกาเป็นประเทศที่เปิดเผยข้อมูลจากภาครัฐมากที่สุด

ที่มา

https://blog.google/products/search/discovering-millions-datasets-web

ค้นหาชุดข้อมูล (Dataset) ผ่านเครื่องมือค้นหาของ Google
Share this

Subscribe to Code on the Hill