【项目情境】
共享单车已成为一张新名片,是打通居民出行“最后一公里”的公共交通工具,是绿色城市、低碳出行的有力保障。但也存在一些困扰和问题:想骑行时却没有车可租;共享单车的大概的投放量有多少;骑行结束时物品忘拿、骑行花费等等问题。本项目站在多个角度聚焦这些问题,通过程序设计、分析数据和系统设计解决共享单车实际使用中遇到的真实问题。
【项目方案】
Ⅰ通过程序设计增加提醒功能,解决骑行结束时物品忘拿问题;
Ⅱ借助流程图,明晰骑行计费收费问题;
Ⅲ通过大数据分析技术,从时间、空间两个维度合理调配单车投放量问题。
【项目实施】
探究活动4:运用大数据分析技术,解决合理投放单车区域问题。
经历数据的需求分析、采集与处理、可视化表达过程,解决合理投放单车区域问题。根据要求,回答问题。
(1)分析明晰共享单车关键数据项包括骑行用户信息、单车信息(编号、经纬度、车况等)、骑行信息(距离、起始和结束时间、路线等),确定数据需求项。这些数据每天产生,在体量和速度上都达到了大数据的规模,具有
________特征。(多选)
A.数据体量大
B.数据类型多
C.价值密度高
D.变化速度快
(2)使用爬虫程序从服务器中获取数据,数据采集方法为
_______(选填:系统日志采集/网络数据采集/传感器采集),存储数据的形式有两种,一种是云存储,一种是
_________,采集后数据存储在“data.csv”文件中。
(3)从时间维度,借助电子表格工具软件Excel进行某一周内工作日与周末单车使用量比例分析,并进行数据可视化表达,得到如图1结果,是使用
________图呈现(选填:百分比圆环图/饼图)。从空间维度,通过经纬度分析,运用K-Means算法对数据进行训练,达到“物以类聚,人以群分”的效果,并得到如图2所示的数据分布。推测数据训练后得到的2个投放单车位置大概在图2中的②号位置和③号位置,这是运用了数据分析中的
__________(选填:特征探索/聚类分析)方法。

图1 图2