大数据分析正在变得更加复杂化

互联网 | 编辑: 何毅 2013-05-20 06:30:00转载

除了了解关于消费者的年龄分段、性别比例之外，企业还想要进一步的了解更多能够诱发消费者的购买行为的复杂的元素。不久前，一家在线的英国零售商进行了一次有趣的而且是非常规的网络数据分析。

这可能并未包括更为广泛的消费人群的消费行为，但这也确实发现了一些看似无关的事件与消费者购买行为之间潜在的联系，给了这家公司一定的显著竞争优势。

应当指出，这绝不是一个孤立的事件。越来越多的企业都早已超越了开始与大数据和传统分析打交道的第一阶段。他们开始需要形成锐化的见解，企业的营销人员已经不再满足于仅仅获得一线消费者的一般性的统计数据(例如，消费者的住址、年龄分段、性别比例)。他们想要进一步的了解更多能够诱发消费者的购买行为的复杂的元素——哪怕这些消费行为是他们在观看球赛转播时发生的。

如果IT部门是为了支持这些深层次的分析，那么更多相互关联的因素的存在便是为了市场上的相关工具，这些工具可以在大数据积累的基础上在其数据库中进行定位，所以可以以新的创新方法质疑这些数据。

到目前为止，Apache Hadoop已经成为一种事实上的非结构化大数据整理排序的标准。Hadoop善于分析多服务器并行处理器大数据的线程，并快速处理这个数据。不过，Hadoop不擅长的是记录正在处理的数据块之间的连接关系。换句话说，如果你企业的系统只使用了Hadoop，要得出英国球迷的妻子们往往在她们的丈夫玩游戏时去网上购物的结论则可能需要花费一些时间了。

针对这种类型的分析，社会化媒体已经开始使用新的工具了。一个典型的例子便是Facebook。某一天，当我登录到我Facebook的主页时，我立刻收到了该网站的新的数据库工具图片介绍。图形工具为广大用户推出了新的大数据情报，如“点击此链接，寻找同样在西雅图喜欢骑自行车的人”、或“点击此链接查看您的朋友最近访问过的伦敦的餐厅”。事实上，这些非常精准而又高度复杂的大数据似乎发掘出了类似于上文所提到的球迷的妻子在球赛期间疯狂网上购物之间的联系。

为了更好的分析这种大数据间的关系，Facebook使用了HBase，HBase是Apache的另一款产品。HBase使用他们自己独特定义主键的一组设置好的表格。每个表都是一个系列，包含表的主键的属性。例如，如果表的主要关键是一个人(例如，“约翰·史密斯”)，表列中的关键属性就可能包含兴趣爱好(例如，“喜欢骑自行车”)或居住地(例如，“在西雅图生活”)。HBase可以像Hadoop一样执行大数据处理产品的能力，以更快、更精细的方式分析不同数据之间的连接类型(以及这可能意味着什么)。

那么，企业的IT部门要注意什么?

很简单，随着您的企业的大数据分析日趋成熟，你也应该开始寻找新的软件和数据库，以便可以解决更复杂的需求。Hadoop是大数据部署的一个很好的开端，但这个过程绝没有结束。

文章转自：机房360

每日精选

国行苹果AI有望9月上线阿里百度提供技术支持

为适配国内法规与用户需求，国行版Apple智能、Siri AI完成全套本土化重构，阿里千问与百度文心将分工承接不同AI能力，打造专属国内的智能服务体系，而这也与早期的爆料消息一致。

标签：苹果| 阿里千问| 百度文心| AI| 2026-07-16
三星折叠屏新品或取消免费升杯改为半价补贴

三星将于7月22日发布的全新折叠屏系列，或将正式取消免费升杯福利。此番调整的核心原因，正是持续上涨的存储芯片成本，让三星难以继续承担全额免费扩容的补贴成本。

标签：三星| 折叠屏| 免费升杯| 2026-07-16
6月TOP电视ODM工厂出货同比微降前十工厂分化明显

全球前十专业电视ODM工厂6月合计出货量同比小幅下滑0.5%，终止此前连续多月同比上行态势；环比5月出货规模提升4.4%。

标签：电视| 茂佳| 京东方| 2026-07-16
REDMI Note17 Pro值得买吗？优缺点一次聊透！

千元机新王？1599元起，Redmi Note17 Pro值得买吗？优缺点一次聊透！

标签： 1599元| Redmi| Note17Pro| RedmiNote17| 2026-07-16
周杰伦现身温网手持机型实锤vivo X300 Ultra

周杰伦现身温网现场，赛场抓拍的高清画面引发网友热议。而除了明星本人之外，周杰伦手中的拍摄设备也备受关注，不难看出这是一款带了专属保护壳的vivo X300 Ultra专业V单

标签：周杰伦| vivo| vivoX300Ultra| 温网| 2026-07-16
东方算芯发布AI芯片DF1000：14nm实现520TFLOPS算力

东方算芯发布旗舰AI芯片DF1000，采用“软件定义+3D堆叠近存计算”架构，在14nm成熟工艺节点上实现520TFLOPS（BF16）算力和6.4TB/s访存带宽，为国产高端AI算力探索一条不依赖先进制程的发展路径。

标签：东方算芯| AI| DF1000| 算力| 2026-07-16
两种配色影像夯爆荣耀Robot Phone蓄势待发

荣耀CEO李健在微博中透露，全球首台机器人手机荣耀Robot Phone已就绪。官方海报可以看出，这款手机具有两种配色，在此前曝光的深色系之外，还会有白色的浅色系配色版本。

标签：荣耀| RobotPhone| 配色| 2026-07-16
OpenAI推出Codex Micro键盘面向AI编程智能体

OpenAI推出首款品牌硬件产品Codex Micro，这是一把配有13枚机械按键的宏键盘，由OpenAI与加拿大键盘厂商Work Louder联合打造，官方将其定位为智能体工作指挥中心。

标签： OpenAI| CodexMicro| 键盘| AI| 2026-07-16
机器人训练组合拳小米发布基座模型Robitcs-1

小米在最近三天，集中展示了在机器人具身领域的成果，在亮出人形机器人工厂成绩单、开源发布具身生成模型Xiaomi-Robotics-U0过后，具身基座模型Xiaomi-Robotics-1也宣告正式发布。

标签：小米| 机器人| Robitcs-1| 具身基座模型| 2026-07-16
购机赠AirPods取消！苹果返校季活动上线，福利缩水

苹果2026年度返校季教育优惠活动今日正式上线，福利明显缩水，延续多年的购机赠送AirPods政策取消，取而代之的是849元专属配件抵扣额度。

标签：苹果| Apple| AirPods| iPad| 2026-07-16