今天阅读了兰德公司提出的提高数据运算速度的解决方案,就是采用“数据湖”的方法进行并行计算处理数据,大大提高了运算速度,同时解决了以往集中式数据中心单点失效的问题。在我看来“数据湖”类似于分布式存储结构,“数据湖”是由联网的计算机组成的网络,它提供存储和计算资源,从而形成用于数据收集和处理的中央存储库。当大文件在不同的计算机上分布成块时,可以通过并行来提高性能。为进一步提升运算速度,我们必须在容忍范围之内舍弃一些东西,比如说运算的准确性。通过这一点,我认识到在处理问题时,我们必须抓住主要矛盾,在没有完美解决方案时,我们必须要舍弃一些次要的东西,从而获得我们最为需要的东西。
领书计划详情