随着亚太眼科学会(Asia-Pacific Academy of Ophthalmology,APAO)永久会址和秘书处落户在中山大学中山眼科中心珠江新城院区眼科学国家重点实验室大楼(中国广州),在大数据时代背景下,建设先进的亚太级眼科学科学数据中心已成为亚太眼科创新战略发展的需要。通过建设科学数据中心,一方面缓解眼科学国家重点实验室项目科研数据增长压力,一方面为眼科大数据与人工智能等新兴科研项目开展提供保障平台,为亚太眼科学科建设打下坚实的数据基础。科学数据中心设计建设遵照国家《科学数据管理办法》实施,以加强和规范科学数据管理,保障科学数据安全,提高开放共享水平,更好支撑国家科技创新、经济社会发展和符合国家信息安全建设方针。
As the Asia-Pacific Academy of Ophthalmology (APAO) secretariat permanently located in the building of State Key Laboratory of Ophthalmology (Guangzhou, China). In big data time, it’s a problem for the development of the Asia-pacific ophthalmology innovation strategy to construct the Asia-pacific science data center of ophthalmology. Through the construction of science data center, alleviate the pressure of the state key laboratory of ophthalmology data growth, for big data and new research fields such as artificial intelligence to provide guarantee, provided a basis for the Asia-pacific eye subject construction. Science data center construction in accordance with national “scientific data management method”, to strengthen and standardize the scientific data management, to ensure the safety of scientific data, improve the level of open sharing, better support scientific and technological innovation, economic and social development and national security as a policy.
目前,中心大部分临床研究中的科研工作处于原始的手工整理阶段,没有一套统一的科研管理工具去实现和规范临床科学数据的信息化管理。大多数研究者依然在使用EXCEL文件等简单文本处理的方式获取和整理数据,再利用相关统计软件进行分析,并且手工录入数据产生的的低效率和高错误率,会数据时效性和准确度,极大的影响临床科研的工作进程。通过对现有的数据业务进行统计发现,眼科辅助检查仪器产生的大量原始数据(图4 ),因存储空间不足和缺乏有效的科学数据管理手段等原因,这些数据并不能直接为临床科学研究提供帮助,通过在原有仪器设备上进行人工分析从而获得结构化数据的落后模式普遍存在,采用移动硬盘等方式保存原始数据而造成数据意外丢失的情况并不罕见。眼科检查仪器数量多,种类杂,中心现有的PACS(PictureArchiving and Communication Systems)系统只能通过DICOM(Digital Imaging and Communications in Medicine)接口获得报告,却无法将报告中的临床数据转换成符合临床科学数据规范的格式进行保存。各仪器厂商软件数据标准的不统一,接口标准的不统一和各自为政的服务模式,注定需要建立一个能够实现临床科学数据符合标准的互联互通管理平台,通过建立临床科学数据管理平台,提高和促进眼科临床科研工作效率和信息化发展。
图4 中心临床科学数据量占比情况统计图
Figure 4 The percentage of clinical science data statistical analysis
3 眼科学数据中心管理体系建设
随着大数据时代的到来和开放存取运动的蓬勃发展,科学数据管理和共享逐渐成为学术界的重要命题。各高校通过成立跨部门、多学科的专门机构,实现了对科研数据进行集中建设,从而更好地实现了科研数据的共享[2]。在国际上,美国联邦政府已通过统一的数据开放平台data.gov向社会开放数据库,此外还通过开源程序平台GitHub启动在线开放数据工程(Open Data Project)共享各种面向政府开放数据库的创新解决方案[4]。欧盟也将基础设施建设作为推进欧洲科学数据共享的重点。欧盟第七框架计划、地平线2020计划资助了多个科学数据共享的基础设施项目,主要包括EUDAT(European data infrastructure)、DASISH项目(Date Ser vice Infrastructure for the Social Sciences and Humanities)和DwB项目(Data Without Boundaries,数据无国界)。亚太眼科学数据中心的建设符合世界主流与国家当前信息化发展形势和要求,其意义将影响深远,积极探讨为推动亚太眼科学发展有着重要的现实意义。
1、国务院办公厅. 国办发〔2018〕17号《科学数据管理办法》[Z].
2018-03-17.
General Office of the State Council. "Scientific data management
solution"[2018] no. 17[Z]. 2016.国务院办公厅. 国办发〔2018〕17号《科学数据管理办法》[Z].
2018-03-17.
General Office of the State Council. "Scientific data management
solution"[2018] no. 17[Z]. 2016.
2、刘兹恒, 曾丽莹. 我国高校科研数据管理与共享平台调研与比
较分析[ J]. 情报资料工作, 2017(6): 90-95.
LIU ZH, ZENG LY. Investigation and Comparative Analysis
of Scientific Research Data Management and Sharing Platform of
Universities in China[ J]. Information and Documentation Services,
2017(6): 90-95.刘兹恒, 曾丽莹. 我国高校科研数据管理与共享平台调研与比
较分析[ J]. 情报资料工作, 2017(6): 90-95.
LIU ZH, ZENG LY. Investigation and Comparative Analysis
of Scientific Research Data Management and Sharing Platform of
Universities in China[ J]. Information and Documentation Services,
2017(6): 90-95.
3、钱鹏. 高校科学数据管理研究[D]. 南京: 南京大学, 2012.
QIAN P. A study on scientific data management in university[D].
Nanjing: Nanjing University, 2012.钱鹏. 高校科学数据管理研究[D]. 南京: 南京大学, 2012.
QIAN P. A study on scientific data management in university[D].
Nanjing: Nanjing University, 2012.
4、杨林, 钱庆, 吴思竹. 科学数据管理生命周期模型比较[ J]. 中华
医学图书情报杂志, 2016, 25(11): 1-6.
YANG L, QIAN Q, WU SZ. Comparison of scientific data
management life cycle models[ J]. Chinese Journal of Medical Library
and Information Science, 2016, 25(11): 1-6.杨林, 钱庆, 吴思竹. 科学数据管理生命周期模型比较[ J]. 中华
医学图书情报杂志, 2016, 25(11): 1-6.
YANG L, QIAN Q, WU SZ. Comparison of scientific data
management life cycle models[ J]. Chinese Journal of Medical Library
and Information Science, 2016, 25(11): 1-6.
5、李正.科学数据质量水平的分析与评估[R]. 中国科学数据大会,
2014.
LI Z. Scientific data analysis and evaluation of quality level[R].
China science data conference, 2014.李正.科学数据质量水平的分析与评估[R]. 中国科学数据大会,
2014.
LI Z. Scientific data analysis and evaluation of quality level[R].
China science data conference, 2014.
6、GB/T35294—2017. 中国科学院计算机网络信息中心. 信息技术科学数据引用[S].
GB/T35294-2017. The computer network information center,
Chinese Academy of Sciences. Information technology science data
references[S]. 2017.GB/T35294—2017. 中国科学院计算机网络信息中心. 信息技术科学数据引用[S].
GB/T35294-2017. The computer network information center,
Chinese Academy of Sciences. Information technology science data
references[S]. 2017.
7、The Precision Medicine Initiative Cohort Program – Building
a Research Foundation for 21st Centur y Medicine[EB/OL].
https://acd.od.nih.gov/documents/reports/DRAFT-PMI-WG-Report-9-11-2015-508.pdf.The Precision Medicine Initiative Cohort Program – Building
a Research Foundation for 21st Centur y Medicine[EB/OL].
https://acd.od.nih.gov/documents/reports/DRAFT-PMI-WG-Report-9-11-2015-508.pdf.
8、民政部信息中心. 中华人民共和国网络安全法[Z]. 2017-05-15.
The Ministry of Civil Affairs information center. Network security law
of the People's Republic of China[Z]. 2017-05-15.民政部信息中心. 中华人民共和国网络安全法[Z]. 2017-05-15.
The Ministry of Civil Affairs information center. Network security law
of the People's Republic of China[Z]. 2017-05-15.