IThao123

我们不支持 IE 10 及以下版本浏览器

It appears you’re using an unsupported browser

为了获得更好的浏览体验,我们强烈建议您使用较新版本的 Chrome、 Firefox、 Safari 等,或者升级到最新版本的IE浏览器。 如果您使用的是 IE 11 或以上版本,请关闭“兼容性视图”。
大数据 云计算 / 大数据_IThao123-IT行业第一站
  • 大数据

Hadoop cdh4.2.1 安装笔记

环境准备: 安装虚拟软件:https://download3.vmware.com/software/wkst/file/VMware-workstation-full-10.0.0-1295980.exe Linux操作系统: http://mirror.nsc.liu.se/centos-store/6.4/isos/x86_64/CentOS-6.4-x86_64-bin-DVD1.iso 安装文

数据仓库的大数据集成

集成策略 数据集成是指将来源于不同系统的数据组合在一起,供业务用户研究不同的行业行为及客户行为的数据处理方式。在数据集成应用早期,数据仅限于交易系统及其应用。业务决

[每天get点新技能]搜商——搜索发展简史(1)

2013-11-08 黄炎雷 IT百问 经过三天的学习,朋友们也大概掌握了些基本的google技巧,不过世界上 不仅仅只有google一家 在做搜索引擎(google现在已经做到一家独大了), Yahoo 和 Microsoft 也

大数据下的字典与排序

如果遇到类这样的问题: 存在一个文本文件,每行一段字符,求出其中重复度大于n的行并输出 解决这个问题就需要一种匹配的方法,具体匹配,可以从字典或排序的角度去思考。 字典

从零开始学习Hadoop--第2章 第一个MapReduce程序

1.Hadoop 从头说 1.1 Google 是一家做搜索的公司 做搜索是技术难度很高的活。首先要存储很多的数据,要把全球的大部分网页都抓下来,可想而知存储量有多大。然后,要能快速检索网页,

首席问题官CSO利用大数据分析挖掘出的五大安全线索

越来越多的CSO们开始依靠数据分析来从海量数据中发现新的安全威胁,并且越来越多的企业IT部门开始利用安全分析技术,信息安全专业人员已经开始从安全分析有所收获。其中最明显

storm-0.8.2源码分析之nimbus运行过程(一)

nimbus运行过程 这部分将详细讲述启动后,nimbus是如何运行的。在之前讲述nimbus启动过程,有提到nimbus.clj中有个通过defserverfn定义的核心函数service-handler,是实现了Thrift的service Nimbus代码

基于地理位置大数据分析的移动广告初创公司PlaceIQ,获C轮15000万美元融资

依靠位置数据进行广告推送早已是司空见惯的事情了,常规做法的结果是,当你靠近某个商家时,你的手机就会噼里啪啦地响起来,弹出关于这个商家的一大堆应用推送。这样做的代价

中国大数据明星企业——阿里巴巴的“数据攻防战”

From:http://www.36dsj.com/archives/4130 平台型企业的大数据应用策略有何特点?阿里巴巴、百度、腾讯等一批平台型企业,汇集了海量用户和商家,聚集成富有张力的生态系统,它们的大数据应

剖析淘宝TDDL(TAOBAO DISTRIBUTE DATA LAYER)

前言 在开始讲解淘宝的 TDDL(Taobao Distribute Data Layer) 技术之前,请允许笔者先吐槽一番。首先要开喷的是淘宝的社区支持做的无比的烂, TaoCode 开源社区上面,几乎从来都是有人提问,无

海量数据处理分析

1. 海量数据处理分析 (作者 北京迈思奇科技有限公司 戴子良) 原文地址: http://blog.csdn.net/DaiZiLiang/archive/2006/12/06/1432193.aspx 笔者在实际工作中,有幸接触到海量的数据处理问题,对其

百度计算广告学沙龙学习笔记 - 内容匹配广告

第三期百度计算广告学沙龙(http://wenku.baidu.com/course/view/1488bfd5b9f3f90f76c61b8d ) 介绍了内容匹配广告和展示广告相关技术。本博客记录观看内容匹配广告部分的一些笔记, 绝大多数为原sl

Spark,一种款速数据分析替代方案之下篇

安装 Scala 和 Spark 第一步是下载和配置 Scala。清单 4 中显示的命令阐述了 Scala 安装的下载和准备工作。使用 Scala v2.8,因为这是经过证实的 Spark 所需的版本。 清单 4. 安装 Scala 要使 Sc

详解MapReduce的模式、算法和用例

MapReduce常用组件介绍 HadoopMapReduce jobs可以切分成一系列运行于分布式集群中的map和reduce任务,每个任务只运行全部数据的一个指定的子集,以此达到整个集群的负载平衡。 Map任务通常为

Hadoop wordcount程序的配置运行

1、MapReduce理论简介 1.1 MapReduce编程模型 MapReduce采用分而治之的思想,把对大规模数据集的操作,分发给一个主节点管理下的各个分节点共同完成,然后通过整合各个节点的中间结果,得

Twitter研发人员John Oskasson分析Twitter后台软件栈

Twitter研发人员John Oskasson分析Twitter后台软件栈 作者 郑柯 发布于 二月 12, 2013 | 讨论 新浪微博 腾讯微博 豆瓣网 Twitter Facebook linkedin 邮件分享 更多 19 稍后阅读 我的阅读清单 John Oskarsso

MapReduce编程实战之“初识”

MapReduce是什么 MapReduce是Hadoop(这种大数据处理生态环境)的编程模型。 既然称为模型,则意味着它有固定的形式。 MapReduce编程模型,就是Hadoop生态环境进行数据分析处理的固定的编程

IBM:大数据如何在5年内改变人类生活

5年内,城市将变得像人一样具备意识。当等车的人增多时,将有更多的公交车自动运行。医生也将使用你的DNA为你定制诊疗建议,即使是癌症这种重大疾病,也可以借助智能计算在几分

大数据量题目的面试笔试题

作者:July、youwang、yanxionglu。 时间:二零一一年三月二十六日 说明:本文分为俩部分,第一部分为10道海量数据处理的面试题,第二部分为10个海量数据处理的方法总结。有任何问题,

CalTech machine learning, video 16 note(RBF)

14:02 2014-10-10 start CalTech machine learning, video 16 RBF(Radial Basis Function) 14:02 2014-10-10 outline: * RBF nearest neighbors * RBF neural networks * RBF kernel methods * RBF regularization 14:14 2014-10-10 the closer you're to xn,
顶部