DNA:让世界逃离暗数据危机的避难所

全球在2010年生成、复制和消费的数据总量约为2ZB (社交网站)

在过去11年内,数据的增长几乎翻了40倍,并且预计未来3年的数据产量将超出过去30年的总和。

在2010年,全球生成、复制和消费的数字数据总量约为2ZB(泽字节),而在2020年增至64.2ZB,2021年估计为79ZB,2022年估计为97ZB,并在2025年增加至181ZB。

需要指出的是,1ZB相当于十万亿亿字节,而这一数字相当于右边跟了21个零,简单说来,它相当于2000多亿张标准DVD光盘的总容量,其中每张光盘的存储空间为4.7GB。

如果我们知道,一张标准DVD光盘的直径为12厘米,那么,这个总量意味着如果将它们连接起来,便可以绕地球600圈——绕地球一圈约有40075公里。

这就是由互联网数据中心(IDC)出台的《2021-2025年全球数据展望报告》中提到的一些内容。这份报告指出,数据的年复合平均增长率(CAGR)约为23%。

数据的规模为什么会出现如此大的增长?

根据国际电信联盟(ITU)公布的数据,在2021年,移动电话用户超过了83亿(超出了地球总人口的数量,因为许多人不只一个账户。因此,估计实际用户超过了53亿),而在同一年,互联网用户超过了50亿。

根据德国Statista数据平台发布的信息,社会网络用户约为47亿。这些日益增长的互联网和数字电话用户每天都会产生大量的数据,而私营公司、公共和政府机构由于在向数字世界快速过渡,每天也会产生庞大规模的数据。

而这将加快物联网(IoT)的普及速度——预计在2025年,物联网的设备数量将会达到420亿,而5G移动网络的用户人数也将大幅上升,并预计会在2025年达到27.5亿。

社会网络的用户数量达到近47亿 (社交网站)

现有的存储媒介是否能够容纳如此之多的数据?

互联网数据中心发布的数据显示,目前的存储介质仅占全球生产数据总量的10%,尽管在预测阶段,即2021年至2025年,存储介质储量的年均增长率估计为19.2%,而能够存储的全球数据总量的比例将会逐年下降。因此,只能永久储存一部分生成的数据,而且有些人也要求删除所有未经分析和利用的数据。

暗数据与环境污染

“碳足迹”可以表明温室气体的排放总量,而在与数字活动相关的商业和数字世界内,其碳足迹相当于社会各个部门碳足迹总量的4%,这与航空部门的碳足迹相近。

然而,与数字活动相关的大部分数据都属于暗数据(Dark Data),即数字存储数据,但却尚未用于任何产生有用结果或决策性的分析。

例如,一个拥有100名工作人员且业务内容与数据相关的企业——例如银行机构或者零售行业,每天会产生近2983GB的暗数据,而如果这些数据被保留一年,那么这个过程产生的碳足迹,相当于6趟从伦敦飞往纽约的航班所产生的碳足迹。

但是,有些商人和政府官员认为有必要保留这些数据,因为随着人工智能的发展,这些数据可能会使今后的分析受益,此外,使用“区块链”技术的趋势日益上升,而这将有助于提高数据质量,因为这种趋势不允许修改或删除任何数据记录,而会要求在每次修改时都必须增加一条新的记录,并且会记下每一次修改的时间,哪怕是非常细微的变动,以防止出现操纵数据的情况。

仅仅一克DNA便可以存储人类在一年内产生的所有知识 (社交网站)

使用数字DNA来储存数据会是解决方案吗?

一克DNA便可以储存人类在一年内创造的所有知识,并且可以完整地将这些数据保存长达几千年的时间,而科学家也得以通过化石识别一匹生活在50多万年前的马的完整基因序列。

DNA是以可轻松读取、录入和复制信息的链条形式的存在。DNA的一个基本特征在于,它是一个极其庞大的数据库,这是其他任何人造存储介质都无法比拟的。通过使用DNA存储技术,人类将在2025年产生的181ZB的数据,便可以被压缩至相当于乒乓球的大小。据信,距离我们能在DNA中存储如此之多的数据,可能只有10年的时间。

根据研究公司的预估,到2024年,将会有30%的公司尝试使用DNA技术来储存数据,以缩减为解决数据加速增长、降低成本和能源使用等问题而找到解决方案所需的时间,从而减少数据对环境的污染。

来源 : 半岛电视台 + 电子网站