1 开放数据是什么
‘开放数据基金会”(Open Knowledge Foundation, OKF)把“开放数据”定义为是一种任何人以任何目的都能够自由免费获取、修改、使用、再利用和重新发布的数据,唯一可能的限制是要标明数据的来源和保持开放共享性。OKF发布的《开放数据手册》将开放数据归纳为五个主要步骤,分别是:
(1) 选取数据集( dataset) :
(2) 采用一个开放许可协议(licence) ;
(3) 使数据可获取(available) :网络批量下载或通过API访问
(4)数据能被用户发现(discoverable),将数据集注册到中心目录(catalog)、门户网站
(5) 便于利用数据。

2 开放数据原则
“开放政府数据”(Open Government Data, OGD)是开放数据的核心,引起了各界人士的关注。早在2007年12月,蒂姆.奥莱理(Tim
O'Reilly)等人制定了OGD的八项原则:
(1)数据必须是完整的,所有开放数据均为可用并且不受有效隐私,安全性或特权限制的数据;
(2)数据必须是原始的,数据是从源头收集,具有尽可能高的粒度级别,而不是以聚合或修改的形式;
(3)数据必须是及时的,为了保持数据的价值,需要尽快提供数据:
(4)数据必须是可获取的,数据用于最广泛的用户且用途广泛;
(5)数据必须是机器可处理的,数据的结构合理,可以进行自动化处理;
(6)数据的获取必须具有无歧视性,任何人获取数据无需注册;
(7)数据格式必须是通用非专有的,数据没有实体且没有控制权的格式提供:.
(8)数据必须是不需要任何许可的,不受任何专利、版权、商标或商业隐藏法规的束缚。合乎情理的隐私、安全和特权限制是允许的。
2010年阳光基金在以上八项原则的基础上添加了持久性和使用成本两个原则。持久性指在一定边界范围内,查找信息的能力保持恒定或维持某--特定状态的持续时间,政府发布出来的信息应该永久地存档在网上,为了方便公众的使用,发布的信息应该保持在线状态,并随着岁月的推移进行适当的版本跟踪和归档。将使用成本降到最小,公众获取访问的成本是获取公开可用信息的最大阻碍中的-个,对大多数政府是否收集数据几乎是没有影响。
除了以上提到的以外还有其他开放政府数据原则,例美国联邦首席信息官I5]公开发表了改进数据透明化的10项原则。Tauberer J在《Open
Government Data:The
Book》的第二版中标明了开放政府数据的14项原则。这些原则都为正确的实施政府开放数据,运动指明了方向,部分原则涉及到了数据质量的定义,说明了数据适用于某些特定目的,也可以作为评估开放政府数据的标准。
3 开放数据的特征
于政府而言,开放数据的特征需具备以下几个方面。
(1)政府数据是公共产品,不涉及个人、机构隐私、国家安全的数据都应该公开。不设限,所有人都可以访问。
(2)数据若不需要特别加工应该免费。用户能够免费获取。
(3)格式为机器可读,即,使用计算机或手持终端可以轻松检索、下载和处理。(4)无版权限制,数据无须授权即可以重复使用和发布。
推荐阅读:《使用现代网络理念构造开放数据中心.pdf》
《普华永道:开放数据资产估值白皮书(31页).pdf》
《上海社会科学院:2020全球重要城市开放数据指数(20页).pdf》