宿主脑阔疼

第580节
加入书签 返回目录 投票推荐
独剩下苏小木沉默不语。
“小木同学,你来说说?”张可点了名。
苏小木简单的答道,“说不好,我觉得大数据无非就是多维分析,最终针对的还是人。”
“每个人都有每个人对大数据的理解,我们的课题只是从大数据出发,探索主导数据、行为模型的一个片段。”
张可道。
“大家可以通过课题,去找到每个人对大数据的新理解。”
“硬件层面的准备基本完善,但软件层面的部署还得我们亲自来,首先是分布式文件系统,我们讨论一下,是否直接使用hadoop实现的分布式文件系统:hdfs?”
张可的问题引发了课题实验组每个成员的意见发表。
首先hdfs基本上是个通用的大数据分布式文件系统,最重要的一点是设计就是用来部署在低廉硬件上的。
包括hadoop,完全就是为了大数据而开发的程序。
hadoop框架最核心的设计就两点,hdfs和mapreduce。
hdfs为海量数据提供了存储方式,mapreduce为海量数据提供了计算。
苏小木试图争取了一下,“教授,如果我们课题的时间足够长的话,不如我们试试自己实现,不借用hadoop,重新设计分布式文件系统、并行运算算法、并行处理数据库这些。”
“这样一来,专业针对的就是课题本身的算法、主导数据与行为模型。”
苏小木的话是有道理的,当然也是有私心的……
2更。
本书来自
第323章 最重要的是要有耐心
对大数据,苏小木想法一直蛮多的。
私心是肯定有的。
因为,大数据需要的技术基本上都是苏小木部分精通乃至非常专家,但不够完美。
像大规模并行处理数据库,苏小木是部分精通。
数据挖掘是非常专家。
分布式文件系统这个底层非常专家甚至完美,上层就是部分精通或者不懂了。
至于可扩展的存储系统……
这个简直就是瞌睡枕头。
苏小木最近的重心基本上全部放在了存储相关的深入研究上。
如果能利用课题研究的机会,从头到尾的根据课题需求设计全面的程序……
苏小木有把握将自己的知识链整理出部分完美的内容。
听苏小木这么问,张可笑了笑,道。
“课题时间上倒是并没有什么具体的要求,但重新开始自主设计的话,耗费的工作量是不是太大了些?”
话里话外的意思,不是很反对。
甚至还有些乐见其成的样子。
很少开口的硕二学长熊正业突然开口道,“教授,如果课题时间线拉得太长的话,我们这边可能稍微有点小问题。”
熊正业突然开口,让张可、谭凌、林唐、苏小木都是一愣。
但苏小木飞快的反应了过来。
这跟华南理工大学的学业设置有很大的关系。
先说苏小木补入的这种创新班,实行的是“3+1+x”的培养模式。
‘x’硕士生为2或3年,博士生为4或5年。
具体x为2、3、4、5的哪种,由各创新班根据专业特点选择。
比如计科本硕连读,是6年制。
部分专业的本硕连读是7年制。
3+1+x的具体意思是,前三年完成除毕业实习、毕业设计(论文)以外的本科课程。
第四年提前进行研究生课程的学习,并完成本科毕业设计。
四年期满获得学士学位,从第五年起取得研究生学籍,攻读硕士或博士学位……
以及在本科期间要有至少一次出国学习经历、至少参加一项大学生创新创业训练计划项目。
最晚在本科三年级阶段,就必须确定学生的研究生导师。
最后一个是苏小木的补入规则并不是突如其来也不是什么运气。


章节目录