داده باز: آمارهای مربوط به ایران در دسترس همه
داده باز ایران: ما که هستیم؟
پایگاه داده باز ایران ابتکار مشترک افراد و سازمانهایی است که به موضوع داده باز و شفافیت علاقهمندند. اسمال مدیا (Small Media Foundation) با همکاری Development Seed این پایگاه را طراحی کرده است. پایگاه داده باز ایران مشتاق گسترش دامنه اعضای خود است، اگر به موضوع داده باز علاقهمندید لطفا با ما تماس بگیرید!
داده باز چیست؟
به زبان ساده و همانگونه که Open Data Institute تعریف میکند، داده باز دادهای است که «همه بتوانند به آن دسترسی داشته باشند، از آن استفاده کنند و به اشتراک بگذارند». Open Knowledge International کتاب راهنمایی در مورد داده باز منتشر کرده و در آن توضیح میدهد که داده در صورتی باز به حساب میآید که از سه اصل اساسی زیر تبعیت کند:
در دسترس باشد، با هزینهای معقول برای باز تولید آن.
استفاده و توزیع مجدد آن امکانپذیر باشد، به این معنی که مجوز آن اجازهی استفاده و توزیع مجدد آن را بدهد.
امکان مشارکت همگانی داشته باشد، به این معنی که استفاده، استفاده مجدد و توزیع دوباره دادهها محدودیتی نداشته باشد.
چرا پایگاه داده باز ایران؟
سازمانهای دولتی و غیردولتی در ایران در همه سطوح -شهری، استانی و ملی- دادههای عمومی فراوانی منتشر میکنند. اما در بسیاری از مواقع این دادهها به راحتی در دسترس نیستند: یا در فرمتهای غیرقابل دسترس مانند پیدیاف یا عکس عرضه شدهاند، یا در پس لایههای مختلف وبسایتهای رسمی آمدهاند یا اصلا در قالب دیجیتال عرضه نشدهاند.
پایگاه داده باز ایران قصد دارد دادههای دولتی و غیردولتی را در یک جا جمع کرده و آنها را در قالبهایی که با ماشین قابل خواندن باشند (مانند CSV یا JSON) در یک کانون مرکزی ارائه دهد. هدف ما این است که به پایگاه آنلاین معتبر داده برای محققان، خبرنگاران و شهروندان ایرانی تبدیل شویم؛ و معتقدیم وجود چنین پایگاهی به افراد کمک میکند تا عملکرد و سیاستهای دولت خود را بهتر درک کنند.
باز و رایگان بودن داده یکی از ویژگیهای کلیدی دولت پاسخگو و مسئول است. در این مسیر، پایگاه داده باز ایران امیدوار است بتواند حوزههایی را که مسئولان ایرانی میتوانند شفافیت فعالیتهای خود را بالا ببرند، برجسته کند. این کار با در اختیار عموم گذاشتن داده و دسترسی راحت به دادهها ممکن است.
روش کار ما چیست؟
یک پایگاه داده باز، خود نیز باید باز باشد. یکی از ویژگیهای برجسته پایگاه داده باز ایران این است که همهی فرآیند تکنولوژی و معماری پلتفرم آن بر روی گیتهاب به صورت عمومی قابل دسترس است. کدهای سایت در اینجا در دسترس است، مشخصات دادهها و همه اطلاعات در مورد دادههای موجود را نیز اینجا میتوان دید.
روش جمعآوری و تمیز کردن داده (که به آن اصطلاحا تمیزکاری داده یا data ingest میگوییم) به ماهیت مجموعه داده بستگی دارد. در برخی موارد ممکن است که اسکریپت خودکار (Automated Script) طراحی کنیم تا کار را برای ما انجام دهد. کد همه اسکریپتهایی که طراحی میکنیم اینجا در دسترس خواهند بود.
برای به دست آوردن دادههایی که در فرمتهای ناخوانا و پیچیده در دسترس هستند نیز از ابزارهای مختلف استفاده میکنیم. به عنوان مثال، برای دادههایی که به صورت پیدیاف عرضه شدهاند در حال حاضر از Tabula استفاده میکنیم که فرایندی دستی است.
راههای مختلفی برای مشارکت در پروژه وجود دارد:
مجموعه دادههای خود را منتشر کنید: اگر دادههای تمیز شده دارید و میخواهید آنها را منتشر کنید، میتوانید آنرا برای ما بفرستید. لطفا به همراه دادههای خود، روش جمع آوری دادهها را نیز که برای تمیز کردن دادهها استفاده کردهاید، بفرستید.
مجموعه داده پیشنهاد دهید: دنبال مجموعه دادهای هستید و اینجا پیدایش نمیکنید؟ اگر مجموعه دادهای سراغ دارید که فکر میکنید باید در پایگاه داده باز ایران در دسترس باشد، لطفا آن را به ما پیشنهاد دهید. اگر مجموعه داده جالب باشد، آن را در لیست کارهایمان میگذاریم.
کد تمیزکاری داده (ingest code) بنویسید: اگر برنامهنویس هستید و میخواهید در نوشتن کد تمیزکاری داده به ما کمک کنید، لطفا با ما تماس بگیرید!
از ما حمایت کنید: در حال حاضر اسمال مدیا حامی پایگاه داده باز ایران است، اما دوست داریم حامیان مالی خود را گسترش دهیم. اگر میتوانید کمک کنید، لطفا با ما تماس بگیرید!
تماس با ماما را در گیتهاب پیدا کنید
پیام برای این مطلب مسدود شده.