Kompensasi Untuk Tanda Zodiak
Substabilitas C Selebriti

Cari Tahu Kompatibilitas Dengan Tanda Zodiak

Bagaimana jurnalis dapat menggunakan Geocommons untuk membuat peta interaktif

Lainnya

Beberapa bulan yang lalu, John Keefe menulis Poynter.org Bagaimana Cara menggunakan shapefile. Kekuatan shapefile, tulisnya, adalah kemampuan untuk merujuk ke wilayah alih-alih titik.

Tetapi bagaimana jika data Anda memiliki titik (misalnya, alamat), dan Anda ingin memetakan wilayah? Katakanlah, misalnya, Anda memiliki alamat pelanggaran lingkungan, dan Anda ingin menunjukkan distrik kongres mana yang paling banyak melakukan pelanggaran. Anda perlu menemukan cara untuk mengaitkan titik-titik itu ke dalam bentuk. Dalam tutorial ini, saya akan menjelaskan bagaimana melakukannya.

Mari kita gunakan contoh dari organisasi tempat saya bekerja, Sunlight Foundation. Kami memiliki situs bernama Data Transparansi , tempat pengguna dapat mengunduh data, beberapa di antaranya menyertakan alamat. Salah satu dataset tersebut adalah data pelanggaran EPA. Buka Data Transparansi, klik tab “EPA”, lalu cari pelanggaran antara 1 Juli 2011 dan 31 Desember 2011. Data Transparansi akan mengembalikan sekitar 1.300 catatan. Klik tombol 'Unduh Data' raksasa untuk menyimpan catatan ke komputer Anda.

Setelah kami mengunduh data itu, kami akan membukanya di spreadsheet. Anda akan melihat bahwa salah satu kolom menyertakan alamat pelanggaran. (Perhatikan, beberapa sel di kolom ini menyertakan beberapa alamat, sementara yang lain tidak memiliki alamat sama sekali. Untuk tujuan kami, kami akan menghilangkan catatan apa pun dengan banyak alamat, atau yang tidak memiliki alamat. Anda dapat merujuk ke cerita sebelumnya ini, “Bagaimana jurnalis dapat menggunakan Excel untuk mengatur data untuk berita” jika Anda memerlukan bantuan untuk melakukannya.)

Kita juga harus memisahkan alamat menjadi bagian-bagian komponennya. Saya akan membuat kolom baru untuk kota, negara bagian, dan ZIP.

(Anda dapat merujuk ke salah satu Cara saya sebelumnya — 'Bagaimana jurnalis dapat menggunakan ekspresi reguler untuk mencocokkan string teks' untuk bantuan tentang ini. Petunjuk, pencarian/penggantian saya adalah untuk mencari:

|_+_|

dan ganti dengan:

|_+_|

Itu akan meninggalkan beberapa kesalahan (seperti nomor suite di bidang kota), yang akan kami perbaiki dengan mencari:

|_+_|

dan diganti dengan:

|_+_|

Setelah data dibersihkan, kami akan mengembalikannya ke spreadsheet kami. Kemudian kami akan mengekspor spreadsheet itu sebagai file teks .csv, atau 'nilai yang dipisahkan koma' yang memberi Anda file yang terlihat seperti ini .)

Sekarang, untuk menggabungkan alamat ini dengan distrik kongres, kita akan menggunakan salah satu alat favorit saya: GeoCommons . Kami akan memulai proses ini dengan mengekspor spreadsheet di atas sebagai CSV, atau file teks 'nilai yang dipisahkan koma'. Saya telah memposting file contoh di sini . Kemudian, kami akan mengunggah CSV itu langsung ke GeoCommons.

Setelah mengunggah ke GeoCommons, kami akan mengikuti petunjuknya hingga layanan meminta kami untuk 'membantu melakukan geolokasi' data. Kami diberikan dua pilihan. Pertama, kita dapat mengasosiasikan, atau menggabungkan, data dengan kumpulan data batas. Jika kita memilih opsi ini, kita akan membutuhkan data batas dalam spreadsheet. Data tersebut mungkin termasuk nama daerah atau kode FIPS, kode distrik kongres, traktat sensus dan sejenisnya. Kami tidak memiliki bidang tersebut dalam data kami.

Opsi kedua, “kode geografis berdasarkan alamat atau nama tempat”, mengambil informasi lokasi, seperti alamat jalan, dan mengubahnya menjadi garis bujur dan garis lintang. Ini adalah opsi yang ingin kita pilih.

Bergantung pada header di file Anda, GeoCommons mungkin secara otomatis membedakan beberapa bidang lokasi. Jika tidak, kita perlu membantu GeoCommons menentukan bidang mana yang menyusun alamat. Untuk melakukan itu, kami akan menggulir ke bawah ke 'alamat lokasi' dan pilih 'edit.' Di sana, kita akan memilih 'alamat jalan'. Kami akan melakukan hal yang sama untuk kota, negara bagian, dan kode pos. Kemudian klik 'Lanjutkan.' (Catatan, GeoCommons hanya dapat melakukan geocode hingga 5.000 alamat per file.) Anda juga dapat menyesuaikan tipe data bidang lain jika Anda mau atau perlu.

Layanan akan memakan waktu beberapa saat untuk memecahkan kode alamat dan mengubahnya menjadi titik lintang dan bujur. Di akhir proses itu, GeoCommons akan memberi tahu kami seberapa baik geolokasi alamat tersebut. Dalam pengujian saya, geocoding memakan waktu sekitar 10 menit. (Jika Anda tidak ingin menunggu file Anda di-geocode, silakan gunakan salinan data saya, tersedia di sini .) Tentu saja, Anda juga dapat menggunakan layanan lain untuk membuat geocode data ke dalam garis lintang dan garis bujur, lalu mengunggah CSV yang berisi bidang tersebut — selain yang lainnya — ke GeoCommons.

Selanjutnya, kita akan memanfaatkan salah satu fitur terbaik GeoCommons: Kemampuannya untuk menganalisis data. Jika kita pergi ke dataset yang baru di-geocode, kita dapat mengakses fitur-fitur ini dengan mengklik tombol 'analisis' di kanan atas halaman.

Ini memunculkan sekumpulan pilihan. Anda harus meluangkan waktu untuk bermain dengan alat ini, tetapi untuk tutorial ini, kita akan memilih yang kedua, 'Agregasi.' Pada kotak dialog yang dihasilkan, kita perlu memilih set batas. Sebuah jendela akan muncul dan kami akan mencari 'Distrik Kongres ke-111.' Di sana, kami akan memilih distrik yang saya unggah. Distrik-distrik ini berbentuk shapefile, yaitu metode penggambaran wilayah berbasis vektor.

Saya telah membatalkan pilihan 'Pertahankan batas kosong', karena saya tidak ingin menunjukkan distrik yang tidak memiliki pelanggaran.

GeoCommons sekarang akan melakukan analisisnya, yang dalam kasus saya, memakan waktu sekitar 20 menit. File yang dihasilkan berada di sini .

Meskipun Anda dapat memetakan kumpulan data yang dihasilkan dalam GeoCommons, menurut saya peta layanan terlalu membatasi. Misalnya, Anda tidak memiliki kontrol penuh atas bagaimana informasi di tooltip peta diformat.

Oleh karena itu, saya suka mengekspor peta dari GeoCommons menggunakan fungsi “Unduh sebagai KML”. File KML yang diekspor GeoCommons berisi semua data, serta informasi batas. Dengan file ini, saya dapat beralih ke Google Fusion Tables, mengimpor KML dan memiliki kontrol penuh atas desain, bayangan, jendela info, dan banyak lagi. John Keefe sudah membahasnya dalam pengantarnya tentang shapefile, jadi saya tidak akan membahas hal yang sama.

Meskipun saya biasanya tidak menggunakan Geocommons untuk peta yang sudah jadi, ini adalah alat yang sangat berharga untuk membuat peta yang informatif dan menarik, terutama ketika berhadapan dengan batas atau area.

Bersenang-senang menjelajahi, dan silakan bagikan pengalaman Anda dengan GeoCommons dan pemetaan di bagian komentar. Jika Anda memiliki topik lain yang ingin dibahas/dibahas oleh seri ini, beri tahu kami.

Cerita ini adalah bagian dari Poynter Peretasan/Peretas seri menampilkan Bagaimana caranya? yang berfokus pada apa yang dapat dipelajari jurnalis dari tren yang muncul dalam teknologi dan alat teknologi baru.