“إنفوتايمز” يقدم دعماً مادياً وتقنياً لإنتاج قصص صحفية مدفوعة بالبيانات

Amr Eleraqi - January 3, 2016 in News

مرصد المجلس الوطني التأسيسي التونسي

الصورة من موقع مرصد المجلس الوطني التأسيسي التونسي

يمكن للصحافيين العرب في شمال أفريقيا و سوريا ولبنان وفلسطين والعراق واليمن التقدم للحصول على دعمٍ ماديٍ وتقني من موقع إنفوتايمز المتخصص في صحافة البيانات، لإنتاج قصص صحفية مدفوعة بالبيانات


تتوفر المنحة طوال عام 2016، لكن يتوجب على الصحافيين المهتمين إملاء الإستمارة المرفقة أدناه



حيث سيقوم فريق من من الصحافيين الإستقصائيين في إنفوتايمز بمراجعة الفكرة، والإتصال المباشر مع صاحبها لمناقشتها وتطويرها ووضع خطة عمل لتنفيذها


يُشترط أن تقدم الفكرة مصحوبة بقاعدة بيانات منظمة وموضوعة داخل جداول بيانات ولن يتم النظر بأي طلبات لا تلتزم بهذا الشرط. كما ينبغي أن تكون الفكرة الصحفية مبنية على بيانات كثيفة، جُمعت من خلال مصادر موثقة للبيانات

The Global Open Data Index for 2015 is Live

Tarek Amr - December 9, 2015 in News, Press Release

The Global Open Data Index for 2015 is out now. Each year, governments make more data available in an open format. The Global Open Data Index tracks whether this data is actually released in a way that is accessible to citizens, media and civil society and is unique in crowd-sourcing its survey of open data releases around the world. Each year the open data community and the Open Knowledge Network produces an annual ranking of countries, peer reviewed by local open data experts. You can read the press release below.

We are excited to announce that we have published the third annual Global Open Data Index. This year’s Index showed impressive gains from non-OECD countries with Taiwan topping the Index and Colombia and Uruguay breaking into the top ten at four and seven respectively. Overall, the Index evaluated 122 places and 1586 datasets and determined that only 9%, or 156 datasets, were both technically and legally open.

The Index ranks countries based on the availability and accessibility of data in thirteen key categories, including government spending, election results, procurement, and pollution levels. Over the summer, we held a public consultation, which saw contributions from individuals within the open data community as well as from key civil society organisations across an array of sectors. As a result of this consultation, we expanded the 2015 Index to include public procurement data, water quality data, land ownership data and weather data; we also decided to removed transport timetables due to the difficulties faced when comparing transport system data globally.

Open Knowledge International began to systematically track the release of open data by national governments in 2013 with the objective of measuring if governments were releasing the key datasets of high social and democratic value as open data. That enables us to better understand the current state of play and in turn work with civil society actors to address the gaps in data release. Over the course of the last three years, the Global Open Data Index has become more than just a benchmark – we noticed that governments began to use the Index as a reference to inform their open data priorities and civil society actors began to use the Index advocacy tool to encourage governments to improve their performance in releasing key datasets.

Furthermore, indices such as the Global Open Data Index are not without their challenges. The Index measures the technical and legal openness of datasets deemed to be of critical democratic and social value – it does not measure the openness of a given government. It should be clear that the release of a few key datasets is not a sufficient measure of the openness of a government. The blurring of lines between open data and open government is nothing new and has been hotly debated by civil society groups and transparency organisations since the sharp rise in popularity of open data policies over the last decade.

odi-600 While the goal of the Index has never been to measure the openness of governments, we have been working in collaborations with others to make the index more than just a benchmark of data release. This year, by collaborating with topical experts across an array of sectors, we were able to improve our dataset category definitions to ensure that we are measuring data that civil society groups require rather than simply the data that governments happen to be collecting.

Next year we will be doubling down on this effort to work in collaboration with topical experts to go beyond a “baseline” of reference datasets which are widely held to be important, to tracking the release of datasets deemed critical by the civil society groups working in a given field. This effort is both experimental and ambitious. Measuring open data is not trivial and we are keenly aware of the balance that needs to be struck between international comparability and local context and we will continue to work to get this balance right. Join us on the Index forum to join these future discussions.

InfoTimes & 16 Secs Sign Partnership Agreement

Amr Eleraqi - November 4, 2015 in News, Press Release

12189891_836773979765491_2525825967778599678_n CAIRO- InfoTimes, an agency that specializes in data journalism and data visualization, has signed a partnership agreement with 16Secs, a video journalism agency.

The agreement aims to develop the work of both agencies and expand their targeted audience through exchange innovative media services.

“The agreement is part of a long term strategy to develop our services, meet our clients’ needs and keep pace with the international new media trends,” said Amr Eleraqi founder and director of InfoTimes. Eleraqi believes that creating such coalitions between entrepreneurship projects will support these projects and ensure its sustainability.

“The partnership with InfoTimes will help us to produce more professional digital content, which address the audience of social media the newest media market now,” said Kareem Farid , the founder of 16 Secs.

According this new partnership agreement, both agencies are going to produce interactive media materials that include data, figures and information presented with the newest data journalism tools in various political, economic, educational, cultural, social and sport topics.

More information:

InfoTimes has started in 2012 as the first Arabic Data journalism website in the Middle East. Infotimes supports media with visually presented data-driven stories with more than 300 infographics and interactive data visualizations in various fields.

16 Secs has started early this year as a platform for video journalism addressing social media audience and keeping pace with the changing global media industry. The agency offers several media services such as producing infographic videos to different media organizations. .

 

InfoTimes Launches Series of Workshops to Strengthen Data Journalism in Egypt

Amr Eleraqi - November 2, 2015 in Events, News, Press Release

 10448685_765905200185703_4956068277541895538_oCairo- InfoTimes has recently launched a number of training workshops on Data Journalism in Egypt, highlighting the centre’s commitment to improving journalists’ skills and professionalism.

Throughout November, InfoTimes is conducting the series of 10 workshops, which were aimed at providing the essential concepts, techniques and skills to effectively work with data and produce compelling interesting data stories.

“It is a privilege for us to help Egyptian journalists learn about this new genre of reporting that takes advantage of the huge number of data sets that are available everywhere,” said Amr Eleraqi, founder and director of InfoTimes. “These courses will cover everything you need to know about infographics and data journalism,” he added.

The workshops are beneficial for both journalists, who have not ventured to do this kind of work before, and practitioners with more experience looking to brush up on the basics of the field. The workshops is also open to people in any field – from designers, developers and public information officers to citizens simply interested in knowing more about these research skills – and it may be particularly useful for editors and managers in the newsroom looking to communicate more effectively with their staff regarding data-based projects.

The workshops cover:

  • Basics of Data Driven Journalism.

  • Collecting and Scraping Data.

  • Analyzing Data.

  • Data Visualization.

  • Data Mapping.

  • Coding for journalists.

All workshops will include videos, tutorials, reading materials, exercises and quizzes.

For more information about the workshops click her, to register please fill this form.

أساسيات جدول البيانات

Tarek Amr - July 16, 2015 in Learn, Tools

جداول البيانات مهمة لصحفيي البيانات وغيرهم ممن يريد التعامل مع جداول الأرقام وإجراء عمليات حسابية وإحصائية عليها بشكل سريع وقابل للمشاركة، في هذا الدليل نوضح أساسيات إستخدام جداول البيانات للمبتدئين

image02

رابط دليل جداول البيانات هنا

موقع إنفوتايمز يخصص زاوية لنشر أعمال مصممي البيانات

Amr Eleraqi - July 7, 2015 in News

موقع إنفوتايمز لصحافة البيانات

أطلق موقع إنفوتايمز المتخصص في صحافة البيانات قسماً خاصاً يتيح من خلاله لمصممي وصحفيي البيانات أن ينشروا موضوعاتهم، إن كانت بصيغة تصماميم الإنفوجرافيك، أو ملفات وخرائط تفاعلية، وذلك من خلال رابط انشر تصميمك المتوفر بالموقع.

يقول عمرو العراقي -مؤسس الموقع- إن الموقع منذ انطلاقه بنهاية عام ٢٠١٢ يهدف لأن يكون منصة لجمع وعرض أعمال المهتمين بمجال صحافة البيانات، مشيراً إلى أن الموقع يوفر أيضا بعض الأدوات المجانية التي تساعد الصحفيين على تصميم البيانات، كالجداول والخرائط الشجرية والمتوفرة في خدمة “أنشئ تصميمك”.

موقع “إنفوتايمز” يعد من المواقع الإلكترونية الرائدة في

مجال صحافة البيانات في العالم العربي، ويغطي الموقع العديد من القطاعات الصحفية المختلفة كالسياسة والفن والاقتصاد والرياضة والصحة والسفر وغيرها من القطاعات التي تتفق مع اهتمامات القارئ العربي.

 

كيفية اختيار الرسم البياني المناسب

Amr Eleraqi - July 4, 2015 in Aware

طريقة تصميم الخرائط الشجرية باستخدام Google Drive

Amr Eleraqi - July 4, 2015 in Tools

إستخراج البيانات من صفحات الإنترنت

alirebaie - July 2, 2015 in Learn, Tools

ما هو المقصود من التجريف؟

وفقا للمعني في المعجم فهي تشير الي الازالة (على سبيل المثال الطبقة الخارجية) من السطح عن طريق ضربات قوية بأداة خشنه أو حادة بينما تجريف الويب يشار اليه في الويكيبيديا كبرنامج كمبيوتر يقوم باستخراج المعلومات من شبكات الإنترنت. تجريف شبكة الإنترنت هو عملية جمع المعلومات من الشبكة العالمية تلقائيا من أجل تقليل الحاجة للبحث اليدوي وتقليل عمليات النسخ واللصق من المواقع.

وبالتالي فان التجريف يصف الطريقه التي يتم بها استخراج البيانات المخفية في الوثائق – مثل صفحات الويب وملفات بي دي إف وجعلها صالحة للاستخدام لإضافة المزيد من المعالجة عليها. ويعتبر التحقيق في البيانات من المهارات الأكثر فائدة اذا تم العمل بها – وهي ليست صعبة بشكل خاص في أغلب الاحيان. وللقيام بأبسط سبل التجريف فأنك لا تحتاج حتى إلى معرفة كيفية كتابة التعليمات البرمجية

 مقدمه مختصرة الي لغة الإتش تي إم إل

ان معرفه بنية موقع على شبكة الانترنت هو الخطوة الأولى نحو استخراج واستخدام البيانات. ولهذا السبب من المفيد أن تتعلم القليل عن لغة الإتش تي إم إل

ان الحصول على البيانات من المواقع قد تبدو معقدة قليلا في البداية – ولكن اطمئن فبمجرد قيامك بها عدة مرات سوف تصبح متشابهة. ولاستخراج البيانات من المواقع نحن بحاجة إلى القاء نظرة خاطفة علي كود الإتش تي إم إل الأساسي. لا تقلق لا تحتاج لفهم كل التفاصيل منه فقط ما يجعلك قادرا على القيام بذلك

الإتش تي إم إل هي اختصار للغة توصيف النص التشعبي وهي اللغة المستخدمة لوصف (علامات الترميز) صفحات الويب. وهي اللغة الأساسيه لانتشاء محتوى صفحه الويب. الإتش تي إم إل  نفسها لا تحدد الطريقة التي تبدو عليها الأمور – فهي تساعد فقط في تصنيف المحتوى والهيكل. لذلك دعونا نلقي نظرة خاطفة على بعض المواقع

قم بفتح موقع يحتوي علي قائمه بكل نواب برلمان المملكة المتحدة بمتصفح جوجل كروم

http://www.parliament.uk/mps-lords-and-offices/mps/

انتقل لأسفل إلى قائمة النواب

انقر بزر الفارة الأيمن على أحد الإدخالات

حدد

Inspect Element

سوف يقوم الكروم بفتح مساحه ثانوية في أسفل الصفحه ليظهر الكود الاساسي للأتش تي إم إل والذي يركز علي العنصر الذي قمت باختياره

الاقواس المدببه هي وسوم  الإتش تي إم إل

قم بتحريك الفارة الي أعلي والي أسفل ولاحظ كيف يمكن للكروم تعريف كل عنصر

يمكنك توسيع وطي قطاعات معينة من خلال النقر على المثلثات

هل لاحظت شيئا ما ؟ كل صف في القائمة الطويلة للنواب هو ضمن قطاع واحد من <tr></tr> حيث تشير <tr> الي صف من الجدول

الاسماء والدوائر في وسوم <td></td>حيث تشير td  الي جدول البيانات اي أننا نتعامل هنا مع جدول

اذا قمت بتمرير الفارة الي أعلي القائمه ستلاحظ  عنصر <table> يتبعه عنصر <tbody> نعم انه جدول الإتش تي إم إل مناسب

تفضل وقم بالاكتشاف !

 الإتش تي إم إل ليست لغزا. إذا كنت ترغب في معرفه المزيد عنها وكيفية انشاء صفحات الويب باستخدامها – قم بزيارة هذا الموقع لقراءة مقدمة بسيطة عنه

School of Webcraft

متصفحات ويب أخري

للقيام بنفس الشيء في المتصفحات الويب الأخرى جرب الطرق التالية.

فايرفوكس Firefox : قم بتثبيت وتنصيب الفاير باج Firebug  (http://getfirebug.com/)

Safari: Preferences > Advanced > Show Develop Menu > Show Web Inspector

ثبت مستكشف للانترنت 7 ( Internet Explorer 7): قم بتثبيت شريط الادوات المطور

عناصر اللإتش تي إم إل

ويتم تحديد العناصر من خلال “وسم”  اسمائها  وقد تحتوي علي نصوص داخلية و “attributes” (named properties): <tag attribute=”value”>text</tag>

الوثيقة بأكملها <tag attribute=”value”>text</tag><html> –

  • <body> – الجزء المقروء من صفحة الويب
  • <table> – إطار عنصر الجدول
  • <tr> – صف في الجدول
  • <td> – خلية من المحتويات داخل الصف
  • <th> – خلية رأس الجدول داخل الصف

استخراج جدول من صفحة ويب باستخدام جداول بيانات جوجل

دعونا نحفظ البيانات المتوفرة لدينا في جدول بيانات – حتى نتمكن من استخدامها فيما بعد. ويتم ذلك بطريقه سهله عن طريق معادلة خاصة في جداول البيانات جوجل.

معادلة جداول بيانات جوجل:

=importHTML(“”,”table”,N)

سوف تقوم بتجريف جدول من صفحة ويب الإتش تي إم إل الي جدول بيانات جوجل. يحتاج عنوان المسار لصفحة الويب المطلوبة وعنصر الجدول المطلوب على حد سواء أن يكونا في علامات اقتباس مزدوجة. العدد N يحدد الجدول N’th في الصفحة (يبدأ العد من 1) كما في الجدول المطلوب لتجريف البيانات.

اقرأ المزيد عن: استخراج جداول الإتش تي إم إل وتحويلها الي جدول بيانات جوجل.

  1. اذهب الي موقع http://drive.google.com وقم بالتسجيل وإنشاء جدول بيانات جديد
  2. حرر الخليه A1 (الخليه بأعلي اليسار)
  3. استخرج جدول محافظات مصر باللغة العربيةhttp://ar.wikipedia.org/wiki/مصر
  4. ادخل المعادله التاليه داخل الخليه

=ImportHTML(“http://ar.wikipedia.org/wiki/مصر”, “table”, 1)

(العدد الاخير يشير إلى عدد الجداول في الوثيقة قم بتجربتها واختبارها والعثور على المتطابق  …)

  1. اضغط زر ادخال
  2. انتظر لبرهة وسوف تري الجدول يظهر بطريقه سحريه
  1. انتظر ليس هذا هو الجدول الذي توقعناه أليس كذلك ؟ يرجع ذلك لأن هناك جداول متعددة في الصفحة وتقوم مستندات ووثائق جوجل باختيار المستند الاول (الرقم1 في نهاية المعادله هو من اعطي الامر بذلك). – ببساطة قم بتغييره إلى 2 أو 3 حتى تحصل على الجدول الصحيح. (تذكر أننا نحاول الحصول على جدول المحافظات المصرية)
  1. بعد تجربة أرقام جدول مختلفة يمكنك معرفة أن الجدول الذي نحاول البحث عنه هو رقم الجدول. وبشكل سحري  يظهر جدول البيانات التي نحتاجها في جدول البيانات وقد تم سحبها مباشرة من صفحة ويكيبيديا. ملحوظ هامه أرقام الجدول ليست واضحة دائما – ابدأ بالرقم 1 وقم بزيادة عدد الجدول حتى تحصل على الارقام الصحيحة.
  2. تهانينا : لقد قمت بتجريف أولي مجموعة البيانات الخاص بك!

تجريف المواقع باستخدام ملحق تجريف للكروم

متى يجب أن اتعلم التجريف؟

هناك عدد من الاسباب

إذا كان عليك استخراج البيانات بانتظام وحيث يوجد العديد من الجداول في صفحة واحدة

إذا تم نشر المعلومات التي تبحث عنها عبر العديد من الصفحات

إذا كنت ترغب في تشغيل المجرفه بانتظام – مثل اذا كان يتم نشر المعلومات كل أسبوع أو شهر

كنت تبحث عن بعض الاشياء مثل تنبيهات البريد الإلكتروني إذا كانت المعلومات على تتغير علي صفحة ويب معينة

….واذا كنت لا تريد أن تدفع لشخص آخر للقيام بذلك نيابة عنك!

ملخص

تغطي هذه الدورة تجريف شبكة الإنترنت وكيفية استخراج البيانات من المواقع. وتتمثل المهمة الرئيسية للتجريف في تحويل البيانات التي الشبه منظمة الي بيانات مهيكلة وجعلها صالحة للاستعمال بسهولة للإضفاء المزيد من المعالجة عليها. علي الرغم أنها مهمة بسيطة نسبيا مع معرفه بسيطة للبرمجة – لصفحات الويب الاحاديه-  أو بدون ادني خبرة الإطلاق. لقد قدمنا ​​= importHTML ملحق التجريف لتلبية الاحتياجات الخاصة بك في التجريف.

لمعرفة المزيد اقرأ

Scraping for Journalism: A Guide for Collecting Data: ProPublica Guides

Scraping for Journalists (ebook): Paul Bradshaw

Scrape the Web: Strategies for programming websites that don’t expect it : Talk from PyCon

An Introduction to Compassionate Screen Scraping: Will Larson

 دليل : استخراج البيانات من داخل ملفات البي دي إف

يمكن لملفات بي دي إف أن تكون في جميع الصور والأشكال – إذا كنت تستعرض ملف بي دي إف منسق علي نحو جيد و لم يتم مسحه ضوئيا فاعطي تابولا  الفرصه لاستخراج المعلومات. كيف يتم ذلك ؟ اطلع علي البحوث القصيرة بأسفل:

سوف تحتاج الي:

  1. ابدأ برنامج Tabula  (بالنقر المزدوج علي ايقونه Tabula)
  2. وجه متصفحك  الي http://127.0.0.1:8080
  3. اختر الملف الذي تود تحميله وانقر Submit
  • انتظر حتى نهاية تحميل ملف PDF
  • انزل بالسهم الي أسفل لصفحه 74- حيث سنقوم باستخراج هذا الجدول

انقر واسحب مربع التحديد فوق الجدول

  • سوف تظهر لك نافذة توضح كيف يمكن لبرنامج Tabula استخراج البيانات. ابدأ الآن في تحميل البيانات كـ CSV

حسنا لدينا الآن مجموعة بيانات للواردات المصرية في تنسيق CSV.

ماذا عن تمثيل هذه البيانات مرئيا في قصة ذات مغزى؟

لحسن الحظ لدينا الآن ادوات رائعة لإنتاج المخططات البيانيه ومن ثم يمكنك وشرها على شبكة الإنترنت.الـ  Datawrapper هو واحد من هذه الأدوات لتمثيل البيانات

اذهب الي http://datawrapper.de إنشاء حساب ثم اضغط على زر “create a chart”

يمكنك حفظ مصدر البيانات هنا وتعديل البيانات. يمكنك أيضا تبديل موضع البيانات وهو ما يعني تحويل الصفوف والأعمدة من أجل الحصول على الصفوف التي تريد أن تصورها كرؤوس الأعمدة.

بعد النقر علي visualize يمكنك تحديد نوع المخطط وصقل الرسم البياني عن طريق تغيير الألوان أو مضيفا العنوان والوصف. أفضل مخطط لنوع البيانات التي لدينا هنا هو مخطط الاعمدة لأن هدفنا من تمثيل هذه البيانات مرئيا  هو اظهار مقارنات بين الواردات في مصر خلال 5 سنوات الماضية.

بعد النقر فوق نشر سوف تحصل على رابط لتمثيل البيانات الخاص وكود HTML ثم يمكنك وضعه في موقع الويب الخاص بك.

ها هي الآن يمكنك النقر على الرابط واللعب بهذا المخطط الرائع: http://cf.datawrapper.de/11mKD/2/

 

New York City, Open Data Challenges

Tarek Amr - July 2, 2015 in Aware

City agencies have access to a wealth of data and statistics reflecting every part of urban life. But as data analyst Ben Wellington suggests in this entertaining talk, sometimes they just don’t know what to do with it. He shows how a combination of unexpected questions and smart data crunching can produce strangely useful insights, and shares tips on how to release large sets of data so that anyone can use them.