राशि चक्र संकेत द्वारा संगतता का पता लगाएं
इंटरेक्टिव मानचित्र बनाने के लिए पत्रकार जियोकॉमन्स का उपयोग कैसे कर सकते हैं
अन्य
कुछ महीने पहले, John Keefe ने एक Poynter.org How To यूज़िंग शेपफाइल्स के बारे में लिखा था। शेपफाइल की शक्ति, उन्होंने लिखा, बिंदुओं के बजाय क्षेत्रों को संदर्भित करने की क्षमता है।
लेकिन क्या होगा यदि आपके डेटा में अंक हैं (उदाहरण के लिए, पते), और आप क्षेत्रों को मैप करना चाहते हैं? मान लें, उदाहरण के लिए, आपके पास पर्यावरण संबंधी उल्लंघनों के पते हैं, और आप दिखाना चाहते हैं कि कांग्रेस के किन जिलों में सबसे अधिक उल्लंघन हैं। आपको उन बिंदुओं को आकृतियों में जोड़ने का तरीका खोजने की आवश्यकता है। इस ट्यूटोरियल में, मैं समझाता हूँ कि यह कैसे करना है।
आइए उस संगठन के उदाहरण का उपयोग करें जिसके लिए मैं काम करता हूं, सनलाइट फाउंडेशन। हमारे पास एक साइट है जिसका नाम है पारदर्शिता डेटा , जहां उपयोगकर्ता डेटा डाउनलोड कर सकते हैं, जिनमें से कुछ में पते शामिल हैं। ऐसा ही एक डेटासेट EPA उल्लंघन डेटा है। पारदर्शिता डेटा पर जाएं, 'ईपीए' टैब पर क्लिक करें, और फिर 1 जुलाई, 2011 और 31 दिसंबर, 2011 के बीच उल्लंघनों की खोज करें। पारदर्शिता डेटा लगभग 1,300 रिकॉर्ड लौटाएगा। अपने कंप्यूटर पर रिकॉर्ड सहेजने के लिए विशाल 'डेटा डाउनलोड करें' बटन पर क्लिक करें।
एक बार जब हम उस डेटा को डाउनलोड कर लेते हैं, तो हम उसे एक स्प्रेडशीट में खोल देंगे। आप देखेंगे कि किसी एक कॉलम में उल्लंघन का पता शामिल है। (ध्यान दें, इस कॉलम में कुछ सेल में कई पते शामिल हैं, जबकि अन्य के पास बिल्कुल भी पते नहीं हैं। हमारे उद्देश्यों के लिए, हम कई पतों वाले या बिना किसी पते वाले किसी भी रिकॉर्ड को समाप्त कर देंगे। आप इस पहले की कहानी का उल्लेख कर सकते हैं, 'पत्रकार कैसे कहानियों के लिए डेटा व्यवस्थित करने के लिए एक्सेल का उपयोग कर सकते हैं' यदि आपको ऐसा करने में सहायता की आवश्यकता है।)
हमें पते को उनके घटक भागों में भी अलग करना चाहिए। मैं शहर, राज्य और ज़िप के लिए नए कॉलम बनाऊंगा।
(आप इस पर मदद के लिए मेरे पहले के हाउ टू में से एक का उल्लेख कर सकते हैं - 'पत्रकार पाठ के तारों से मेल खाने के लिए नियमित अभिव्यक्तियों का उपयोग कैसे कर सकते हैं'। संकेत, मेरी खोज/प्रतिस्थापन को खोजना था:
|_+_|और इसके साथ बदलें:
|_+_|इससे कुछ त्रुटियां रह जाएंगी (जैसे कि शहर के क्षेत्र में सुइट नंबर), जिन्हें हम खोज कर ठीक कर देंगे:
|_+_|और इसके साथ बदल रहा है:
|_+_|डेटा साफ होने के साथ, हम इसे अपनी स्प्रेडशीट में वापस लाएंगे। फिर हम उस स्प्रैडशीट को एक .csv, या 'अल्पविराम से अलग किए गए मान' टेक्स्ट फ़ाइल के रूप में निर्यात कर देंगे, जिससे आपको फ़ाइल जो इस तरह दिखती है ।)
अब, इन पतों को कांग्रेस के जिलों के साथ जोड़ने के लिए, हम अपने पसंदीदा टूल में से एक का उपयोग करने जा रहे हैं: जियोकॉमन्स . हम उपरोक्त स्प्रैडशीट को CSV, या 'अल्पविराम से अलग किए गए मान' टेक्स्ट फ़ाइल के रूप में निर्यात करके इस प्रक्रिया को शुरू करेंगे। मैंने यहां एक उदाहरण फ़ाइल पोस्ट की है . फिर, हम उस CSV को सीधे GeoCommons पर अपलोड करेंगे।
जियोकॉमन्स पर अपलोड करने पर, हम तब तक संकेतों का पालन करेंगे जब तक कि सेवा हमें डेटा को 'जियोलोकेट करने में मदद' करने के लिए नहीं कहती। हमें दो विकल्प दिए गए हैं। सबसे पहले, हम डेटा को एक सीमा डेटासेट के साथ जोड़ या जोड़ सकते हैं। यदि हम इस विकल्प का चयन करते हैं, तो हमें स्प्रेडशीट में सीमा डेटा की आवश्यकता होगी। इस तरह के डेटा में काउंटी नाम या FIPS कोड, कांग्रेस के जिला कोड, जनगणना पथ और इसी तरह शामिल हो सकते हैं। हमारे डेटा में वे फ़ील्ड नहीं हैं।
दूसरा विकल्प, 'पते या स्थान के नाम पर आधारित जियोकोड', स्थान की जानकारी लेता है, जैसे कि सड़क का पता, और उसे देशांतर और अक्षांश में परिवर्तित करता है। यह वह विकल्प है जिसे हम चुनना चाहते हैं।
आपकी फ़ाइल में शीर्षलेख के आधार पर, GeoCommons स्वचालित रूप से कुछ स्थान फ़ील्ड को पहचान सकता है। अन्यथा, हमें जियोकॉमन्स को यह निर्धारित करने में मदद करने की आवश्यकता होगी कि कौन से फ़ील्ड पते की रचना करते हैं। ऐसा करने के लिए, हम 'स्थान का पता' तक नीचे स्क्रॉल करेंगे और 'संपादित करें' चुनेंगे। वहां, हम 'सड़क का पता' चुनेंगे। हम शहर, राज्य और ज़िप कोड के लिए भी ऐसा ही करेंगे। फिर 'जारी रखें' पर क्लिक करें। (ध्यान दें, GeoCommons प्रति फ़ाइल केवल 5,000 पते तक जियोकोड कर सकता है।) यदि आप चाहें या आवश्यकता हो तो आप अन्य फ़ील्ड डेटा प्रकारों को भी समायोजित कर सकते हैं।
पते को डीकोड करने और उन्हें अक्षांश और देशांतर बिंदुओं में बदलने में सेवा को कुछ समय लगेगा। उस प्रक्रिया के अंत में, जियोकॉमन्स हमें बताएंगे कि यह पतों को भौगोलिक स्थिति में लाने में कितनी अच्छी तरह सक्षम था। मेरे परीक्षण में, जियोकोडिंग में लगभग 10 मिनट लगे। (यदि आप अपनी फ़ाइल को जियोकोड में प्रतीक्षा नहीं करना चाहते हैं, तो बेझिझक मेरे डेटा की एक प्रति का उपयोग करें, जो उपलब्ध है यहां .) बेशक, आप डेटा को अक्षांश और देशांतर में जियोकोड करने के लिए अन्य सेवाओं का भी उपयोग कर सकते हैं, और फिर उन सभी फ़ील्ड वाले CSV को - अन्य सभी के अलावा - GeoCommons पर अपलोड कर सकते हैं।
इसके बाद, हम जियोकॉमन्स की सर्वोत्तम विशेषताओं में से एक का लाभ उठाने जा रहे हैं: डेटा का विश्लेषण करने की इसकी क्षमता। यदि हम अपने नए जियोकोडेड डेटासेट पर जाते हैं, तो हम पृष्ठ के ऊपरी दाएं भाग में 'विश्लेषण' बटन पर क्लिक करके इन सुविधाओं तक पहुंच सकते हैं।
यह विकल्पों की एक आभासी लाता है। आपको इन उपकरणों के साथ खेलने में कुछ समय बिताना चाहिए, लेकिन इस ट्यूटोरियल के लिए, हम दूसरा, 'एकत्रीकरण' का चयन करने जा रहे हैं। परिणामी डायलॉग बॉक्स पर, हमें एक सीमा सेट का चयन करना होगा। एक विंडो पॉप अप होगी और हम '111वें कांग्रेसनल डिस्ट्रिक्ट्स' की खोज करेंगे। वहां, हम उन जिलों का चयन करेंगे जिन्हें मैंने अपलोड किया है। ये जिले शेपफाइल्स के रूप में हैं, जो क्षेत्रों का वर्णन करने की वेक्टर-आधारित विधि है।
मैंने 'खाली सीमाएं रखें' का चयन रद्द कर दिया है, क्योंकि मैं उन जिलों को नहीं दिखाना चाहता जहां शून्य उल्लंघन हैं।
जियोकॉमन्स अब अपना विश्लेषण करेगा, जिसमें मेरे मामले में लगभग 20 मिनट लगे। परिणामी फ़ाइल स्थित है यहां .
यद्यपि आप परिणामी डेटासेट को जियोकॉमन्स के भीतर मैप कर सकते हैं, मुझे लगता है कि सेवा के नक्शे बहुत सीमित हैं। उदाहरण के लिए, मानचित्र टूलटिप्स में जानकारी को कैसे स्वरूपित किया जाता है, इस पर आपका पूर्ण नियंत्रण नहीं है।
इस कारण से, मैं 'KML के रूप में डाउनलोड करें' फ़ंक्शन का उपयोग करके जियोकॉमन्स से मानचित्र को निर्यात करना पसंद करता हूं। KML फ़ाइल GeoCommons निर्यात में सभी डेटा, साथ ही सीमा संबंधी जानकारी शामिल होती है। इस फ़ाइल के साथ, मैं Google फ़्यूज़न टेबल की ओर रुख कर सकता हूं, KML आयात कर सकता हूं और डिज़ाइन, छायांकन, जानकारी विंडो और बहुत कुछ पर पूर्ण नियंत्रण रख सकता हूं। जॉन कीफ ने पहले ही शेपफाइल्स के अपने परिचय में इसे कवर कर लिया था, इसलिए मैं उसी मैदान को कवर नहीं करूंगा।
जबकि मैं आम तौर पर तैयार नक्शे के लिए जियोकॉमन्स का उपयोग नहीं करता, यह सूचनात्मक और आकर्षक मानचित्र बनाने के लिए एक अमूल्य उपकरण है, खासकर जब सीमाओं या क्षेत्रों से निपटते हैं।
एक्सप्लोर करने में मज़ा लें, और कृपया टिप्पणी अनुभाग में जियोकॉमन्स और मैपिंग के साथ अपना अनुभव साझा करें। यदि आपके पास अन्य विषय हैं, तो आप इस श्रृंखला को कवर/पता देना चाहेंगे, हमें बताएं।
यह कहानी एक पोयंटर का हिस्सा है हैक्स/हैकर्स श्रृंखला की विशेषता कैसे यह इस बात पर ध्यान केंद्रित करता है कि पत्रकार प्रौद्योगिकी और नए तकनीकी उपकरणों में उभरते रुझानों से क्या सीख सकते हैं।