`
houzhaowei
  • 浏览: 492768 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

云计算实战 (海量日志管理)hadoop + scribe -- scribe 介绍和安装

阅读更多

scribe 介绍:

 

scribe 是facebook 开源的分布式日志系统 。 可以用java 借助log4j 向分布式scribe 写入日志。

 

安装环境: centos5.2

 

所需软件:

 

 

安装过程:

一、输入gcc –v 检查gcc版本是否>3.3.5

       是,则继续下一步。否,则安装gcc

二、安装ruby python 

python 用默认安装路径。Ruby 推荐使用默认路径

    安装过程均为./configure  make  make install

三、安装lievent  

解压安装即可

       安装过程为./configure  make  make install

四、安装 boost    

解压安装即可(不可改路径)

       http://hi.baidu.com/maydaygmail/blog/item/9e38993bf4a176dc7c1e716c.html

五、安装 php libxml2 

先安装libxml2 php依赖它) 在安装php(默认安装路径)

       安装过程均为./configure  make  make install

六、安装facebook 服务-- thrift fb303

       首先解压并进入thrift 目录      

./bootstrap.sh

./configure –with-boost=/usr/local/include/boost/ -- with-php-config=/phppath /bin/php-config

make

make install    

thrift 安装完毕。

在当前目录 cd contrib/fb303/

./bootstrap.sh

./configure –with-boost=/usr/local/include/boost/

make

make install

fb303安装完毕。

七、安装scribe

       ./bootstrap

./configure –with-boost=/usr/local/include/boost/

make

make install

 

安装完毕。

 

配置环境变量 :

BOOST_ROOT=/usr/local/include/boost/

LD_LIBRARY_PATH=/usr/local/include/boost/lib::/usr/lob:/usr/local/lib

测试:

        /usr/local/bin/scribed  [scribe 解压目录]/examples/example1.conf 


    
回车会出现:

     [Sun Oct 31 23:37:38 2010] "STATUS: STARTING"

[Sun Oct 31 23:37:38 2010] "STATUS: configuring" 
[Sun Oct 31 23:37:38 2010] "got configuration data from file </home/setups/scribe/scribe/examples/example1.conf>" 
[Sun Oct 31 23:37:38 2010] "CATEGORY : default" 
[Sun Oct 31 23:37:38 2010] "Creating default store" 
[Sun Oct 31 23:37:38 2010] "configured <1> stores" 
[Sun Oct 31 23:37:38 2010] "STATUS: " 
[Sun Oct 31 23:37:38 2010] "STATUS: ALIVE" 
[Sun Oct 31 23:37:38 2010] "Starting scribe server on port 1463" 
Thrift: Sun Oct 31 23:37:38 2010 libevent 2.0.7-rc method epoll

 

okay  scribe 服务已启动。 (这个不只是测试,也是启动scribe 服务的方式。)

 补充:

  关于scribe 的安装 在下载目录下有个有个readme 写的很详细(可能没我写的实用^^)

  scribe的启动和集群测试,均在examples 目录下的redme 上 写得相当详细。

  如果大家在集群上有疑问,可交流^^

分享到:
评论
13 楼 houzhaowei 2012-03-12  
star22 写道
楼主是全部部件都装在一台机器上吗?

对 ,就是一个scribe的server机器
12 楼 star22 2012-03-08  
楼主是全部部件都装在一台机器上吗?
11 楼 nwf5d 2011-02-11  
Scribe、Chukwa和Flume的应用场景是大量日志服务器,收集日志到集群上吧。其中Chukwa更适合收集集群运行信息以利于管理配置。不知道您的应用场景是否需要这个呢?考虑过Chukwa和Flume吗?现在使用Scribe是否稳定?希望能和您多交流,MSN:nwfengwolf@hotmail.com QQ:77878449
10 楼 houzhaowei 2011-01-14  
ciyuanlong 写道
scribe输出给hdfs,是实时put的还是?

用rsync 同步到hadoop 的master 再执行cron 定时导入到hdfs。
9 楼 ciyuanlong 2011-01-14  
scribe输出给hdfs,是实时put的还是?
8 楼 houzhaowei 2010-11-01  
7 楼 houzhaowei 2010-11-01  
cw550284 写道
希望楼主能坚持写下去!!

会的,我在做集群和配置时遇到各种麻烦,国内没有blog 能帮我解决,都是读的英文文档。所以我希望能写的尽善尽美,能帮国内朋友解决些问题。大家有问题可一起交流解决。
scribe + log4j 、 scribe 把日志写入 hadoop  、 以及hadoop 的实际应用  都会相继写入博客。
6 楼 houzhaowei 2010-11-01  
cx6445 写道
scribe,国内知道的人不多,参加过hadoop沙龙吧?

没有,我近期才涉及云计算,分布式scribe 和 hadoop 都是我一个人在搞。以后希望和大家多交流。
5 楼 caibinbupt 2010-11-01  
Scribe的意义在于做HDFS的前端,Flume也可以干类似的事情
mongodb应该不合适使用Scribe的场景,设计的目标不一样
Scribe现在的开发不是很活跃,听说后续有新版本要发布
Scribe是一些后续系统的基础,如FB的实时搜索
4 楼 ray_linn 2010-11-01  
ms和云计算没啥关系,顶多算个分布式而已,贼种东东也不需要啥scribe,用mongodb或者jackrabbit照样可以实现。
3 楼 cx6445 2010-11-01  
scribe,国内知道的人不多,参加过hadoop沙龙吧?
2 楼 cw550284 2010-10-31  
希望楼主能坚持写下去!!
1 楼 tsxm 2010-10-30  
ruby,python,java...

相关推荐

    scribe+hadoop+log4j+hive+mysql

    一个月研究时间试验后总结的文档用户系统日志数据分析 比较实用

    HADOOP课程大纲.pdf

    模块二 Hadoop生态系统介绍和演示 Hadoop HDFS 和 MapReduce Hadoop数据库之HBase Hadoop数据仓库之Hive Hadoop数据处理脚本Pig Hadoop数据接口Sqoop和Flume,Scribe DataX Hadoop工作流引擎 Oozie 运用Hadoop...

    论文研究-基于scribe和Hadoop的海量数据分析系统的设计与应用 .pdf

    基于scribe和Hadoop的海量数据分析系统的设计与应用,刘彤,辛阳,随着互联网、移动互联网和物联网的发展,各种终端、信息收集器的数量和种类不断增加,每个人、世间万事万物每时每刻产生的大量数

    分布式跟踪系统Zipkin.zip

    Zipkin 使用 Apache Cassandra 做为数据存储系统,使用 Apache ZooKeeper – the Hadoop configuration management software – for coordination, and Facebook's Scribe data aggregation system as the logging ...

    通过系统日志采集大数据

    目前使用最广泛的、用于系统日志采集的海量数据采集工具有 Hadoop 的 Chukwa、ApacheFlumeAFacebook 的 Scribe 和 LinkedIn 的 Kafka 等。 以上工具均采用分布式架构,能满足每秒数百 MB 的日志数据采集和传输需求。

    大数据技术体系.pdf

    ⼤数据技术体系 ⽂件存储:Hadoop HDFS、Tachyon、KFS 离线计算:Hadoop MapReduce、Spark 流式、实时计算:Storm、Spark Streaming、S4、Heron K-V、NOSQL数据库:HBase、Redis、MongoDB 资源管理:YARN、Mesos ⽇...

    大数据下的数据分析平台架构.pdf

    互联⽹企业的海量数据采集⼯具,有Facebook开源的Scribe、LinkedIn开源的 Kafka、淘宝开源的Timetunnel、Hadoop的Chukwa等,均可以满⾜每秒数百MB的⽇志数据采集和传输需求,并将这些数据上载到Hadoop 中央系统上。...

    数据采集在大数据中的应用.doc

    绝大部分的互联网企业都拥有自己专属的海量数据采集 工具,一般是用于对系统日志进行采集,例如Hadoop的Chukwa、Fecebook专用的Scribe 以及Cloudera的Flume等等,这些工具都是采取分布式类型的架构,可以满足很大的...

    大数据处理流程.pdf

    和Flume类似的另⼀个框架是Scribe(FaceBook开源的⽇志收集系统,它为⽇志的分布式收集、统⼀处理提供⼀个 可扩展的、⾼容错的简单⽅案) Kafka:通常来说Flume采集数据的速度和下游处理的速度通常不同步,因此实时...

    beihu-bigdata:大数据

    数据处理:Hadoop、Spark、Storm、Flink、Pig、Tez、Impala、Presto、Kylin、Drill、Phoniex、Beam、Apex 数据存储:HBase、HDFS、Cassandra、Kudu、Alluxio、Parquet 数据仓库:Hive、HAWQ 分布式协调:Zookeeper ...

    大数据中数据采集的几种方式.pdf

    ⼤数据中数据采集的⼏种⽅式 ⼀、采集⼤数据的⽅法 1.1通过系统⽇志采集⼤数据 ⽤于系统⽇志采集的⼯具,⽬前使⽤最⼴泛的有:Hadoop 的Chukwa、ApacheFlumeAFacebook的Scribe和LinkedIn的Kafka等。这 ⾥主要学习...

Global site tag (gtag.js) - Google Analytics