nginx介绍
一款轻量级的web是nginx, 也是反向代理服务器和电子邮件代理服务器。其、优点在于占有内存少,并发能力高,实际上它的并发能力确实在同等条件下相同类型的服务器中效果明显。通常情况下,我们会把nginx服务器当做一个静态资源的访问容器。
nginx安装步骤
1. 用户root登录。
2. 观察nginx信息,执行命令:yum info nginx.
3. 如果nginx提示nginx找不见的信息,通过修改rpm源来处理后续操作,执行命令:rpm -ivh http://nginx.org/packages/centos/6/noarch/rpms/nginx-release-centos-6-0.el6.ngx.noarch.rpm
4. 观察nginx信息。
5. 安装,执行命令: yum install nginx。在安装的过程可以输入y。
6. 启动nginx,执行命令:service nginx start
7. 访问http://192.168.0.120 查看nginx下的web页面。
flume介绍:
它是的特点是,一个提供高可用的,高可靠,聚合和传输的系统,支持日志系统中定制各类数据发出和运用于收集数据信息;同时它也能够提供对数据进行简易的操作和处理,并把数据写到接受对方。
现在flume只有两个版本,
flume0.9x 之前名字叫:flume-og
flume1.x 之前的名字叫:flume-ng
它们的主要区别如下:
flume-og采用master结构体,能够保证数据的统一性,把zookeeper引入进行管理。flume-ng就取消了master和zookeeper管理机制,变成了单一的传输工具。
flume-ng采用不同线程对数据进行读写;在flume-og中,读数据和写数据是由相同的一个数量的线程处理的,写的比较慢,说明阻塞flume的接收数据的当然只是肯能。
flume结构体
flume选择agent为基本单位,单个agent包含source、channel、sink,三种组件。
source组件功能是接收外部数据,将数据传递到channel中;
sink组件功能是发送flume,接收到数据到目的地;
channel作用为数据传输和保存。
flume结构分为三类:1:单agent结构:2:多agent链式,3:多路复用agent。
多agent链式结构
多路复用agent结构
source介绍
source的作用就是接收客户端发来的数据,将数据发到channel中,source和channel是多对多关系,通常情况下一个 source会相对应多个channel。
flume常用的source都有这些:avro source、thrift source、exec source、kafka source、netcat source等。
格式看下图
channel介绍
channel的就是提供一个数据传输隧道,供数据传输和存储。
source将数据放到channel中,sink从channel中获得数据。
flume用的channel都有有:memory channel、jdbc channel等。
格式看下图:
sink介绍
sink作用就是定义数据写出形式,通常情况sink从channel中拿来的数据,将数据写出到file、hdfs上。
channel和sink关系是一对多的关系。
flume用sink都有有:hdfs sink、hive sink、file sink、hbase sink等。
格式如下:
安装flume步骤
·下载flume:wget
· 修改conf/flume-env.sh文件
· 添加到flume的bin目录到环境变量中去。
· 验证是否安装成功,执行命令: flume-ng version
flume案例
nginx身为日志服务器,通过exec source监听日志文件,使用memory channel作为数据传输隧道,用hdfs sink将数据存储到hdfs上面。
感谢谢今日头条平台,大家喜欢交流技术的加群233025331,里面提供技术解答和行业交流!