云计算/大数据
qq_24522589

Hadoop(Day11) -- Hbase

一.Preface: https://en.wikipedia.org/wiki/Apache_HBase 二.Installation 1.Transfer jar und...
5
txgANG

分布式消息队列Kafka 之 kafka简单部署及使用

*刚开始看这一块,肯定会有错误出现,如有发现还希望指出,不喜勿喷!! 部署过程(假设已经安装了zookeeper和kafka) 先添加路径配置环境变量 再进行配置kafka文件serve...
5
qq_38157974

MySQL主从同步

Mysql的主从数据库没有同步  先上Master库:  mysql>show processlist; 查看下进程是否Sleep太多。发现很正常。  show master status; 也...
3
qq_38170230

Linux CentOS 6.9安装 jdk-9.0.4_linux-x64

Linux CentOS 6.9安装 jdk-9.0.4_linux-x64 目录 1、下载JDK 2、卸载JDK 3、安装JDK 3、.rpm后缀格式JDK安装方式...
7
财富坊cff888htbeker

爬虫学习-今天我爬了电影天堂

5
christianashannon

windos10 aws 深度学习云主机配置

参考 在AWS上配置深度学习主机 AWS 文档: 因为本地开发环境受限(没有高端显卡),于是深度学习运算只能使用各大厂的云主机;经过对比,发现亚马逊的aws在深度学习虚拟主机的搭建上性价比最高,于...
8
lvdepeng123

快速排序的思想

快速排序算法是基于分治策略的另一个排序算法。 该方法的基本思想是: 1.先从数列中取出一个数作为基准数,记为x。 2.分区过程,将不小于x的数全放到它的右边,不大于x的数全放到它的左...
7
liumiaocn img

Linux下语言环境的设定

根据一条常见的常见的ssh命令的提示信息,简单整理内容如下: 一条错误的确认 现象 本地的virtual box的一个安装了centos7.4虚拟机,通过ssh登陆时候提示了如下错误: l...
8
guifei010

练习--手机产品信息--函数、文件读写

''' 手机销售系统     手机品牌    手机价格    库存数量      vivoX9               2798          25      iphone7(32G)...
3
gongpulin

Elasticsearch 5.4 Indices(索引) API

/bc5/napoay/article/details/73251965 前言一索引管理 1 创建索引2 删除索引3 查看索引信息4 索引是否存在5 关闭打开索...
2
gongpulin

Elasticsearch 5.4 Mapping详解

/bc5/napoay/article/details/73100110 前言一Field datatype字段数据类型 1string类型2 text类型3 ...
12
banche163

解决在alpine下无法使用数组表达式的问题

通过alpine作为基础镜像构建容器镜像已经成为默许的标准,当然,在alpine下也有许多坑需要填,最近在制作镜像时,又遇到了新问题,在脚本中使用数组(1,2,3)时提示如下错误:syntax err...
5
silentwolfyh img

Git常用方法

目录 1、文件忽略 ————————————————- 1、文件忽略 第一步:去掉索引 git rm -r –cached .idea 第二步:添加移除项 git add ....
10
shuaidan19920412

Spark各种问题汇总

1.  spark streaming 与kafka报错 不能序列化ConsumerRecord, 描述:object not serializable (class: org.apache.kaf...
2
qwe19961228

大数据分布式系统涉及的一些基本概念(二)

大数据分布式系统涉及的一些基本概念(二) hdfs架构 元数据块 数据块 读写策略 hdfs架构 HDFS 采用Master/Slave的架构来存储数据,这种架构主要由四个部分组...
2
mzyqyyjpx

Spark中ml和mllib的区别

Spark中ml和mllib的主要区别和联系如下: ml和mllib都是Spark中的机器学习库,目前常用的机器学习功能2个库都能满足需求。spark官方推荐使用ml, 因为ml功能更全面更灵活...
8
qq_34523222

HIve的基本操作

?? 2.基本操作 2.1Create Table 2.1.1介绍 ? CREATE TABLE 创建一个指定名字的表。如果相同名字的表已经存在,则抛出异常;用户可以用 IF NOT EXIS...
2
weixin_39478115

sparksession功能和特性

从Spark2.0开始,一个最大的改变就是,SparkSQL的统一入口是SparkSession,SQLContext和HiveContext未来会被淘汰,可以通过使用SparkSession.bui...
2
weixin_41577291

R中prophet包说明文档(二)

Prophet 名称:自动预测过程 版本:0.2.1 日期:2017-11-08 描述:实现了一个时间序列的预测过程,基于能够拟合年度、周等周期以及假期等因素的非线性趋势的加法模型。模型要求至...
5
stpeace

用大白话聊聊分布式系统 (写得很好)

转自:/bc5/kkkloveyou/article/details/60493832#t4        一提起“分布式系统”,大家的第一感觉就是好...
11
weixin_39478115

spark版本详解解释

解释: Major version:API的改变和性能的大幅度的改变 Minor version:增加了一些API Patch version:修复补丁
4
财富坊cff888qq_38161676

MapReduce实现WordCount以及常见问题解决

Hadoop环境开发环境测试  最近在做一个大数据方面的小工程,需要使用基于hadoop环境进行计算。MapReduce是Hadoop生态系统下的成熟的计算框架,在开发之前需要搭建MapRe...
5
weixin_39478115

jupyter的python2和python3共存解决方案

效果图: 解决办法: 安装anaconda3 点击Anaconda Navigator 第一步:查看安装了那些包     conda list 第二步:在安装pyt...
6
zhangzc12409

转载-centos7下用rpm 安装mysql

网上搜了好多篇,尝试了很多方法,还是这个方法好:centos7.2下安装mysql5.7,使用rpm包安装  如下: 0、环境 本文操作系统: CentOS 7.2.1511 x86_6...
3
qq_41471281

python3数据分析第4天

pandas库 介绍:基于numpy创建 series 1 类似于以为数组对象,有一组数据和一组与之相关的数据标签组成 2 可以通过values和index属性获取表达形式和索引对象 ...
3
weixin_39478115

kafka性能调优

Broker参数配置 1、网络和io操作线程配置优化 # broker处理消息的最大线程数(默认为3) num.network.threads=cpu核数+1 # broker处理磁盘IO的线程...
4
qq_34834325

Storm部署流程

8
weixin_41577291

R中prophet包说明文档(一)

?? 名称:自动预测过程 版本:0.2.1 日期:2017-11-08 描述:实现了一个时间序列的预测过程,基于能够拟合年度、周等周期以及假期等因素的非线性趋势的加法模型。模型...
3
weixin_39478115

kafka数据存储

解释:     Topic类似一个队列,里边存放同一个Topic的很多分区,并且对应不同的日志文件和索引文件,并且可以设置副本数,副本数必须小于Kafka集群数。     只要订阅了topic,生...
8
A__Ant

GeoAnalyticsServer在Linux下集群部署手册

1         GeoAnalyticsServer分布式部署架构图 此次使用三台机器进行矢量大数据服务器分布式部署,与单机部署不同,此次部署剥离比较消耗硬件资源的大数据计算节点、存储节点,...
6

预告
img 进军Web前端工程师
讲师:曾亮老师

专家申请

img
江雪桥

2011年4月--2014年6月 任职于全美第二大的广播公司Live365(期间在美国总部...

img
叶志远

Spring Cloud中国社区核心成员,地址:https://github.com/Sp...

img
谭东

GitChat地址:http://gitbook.cn/gitchat/activity/...

更多

日榜

官方博客

img博客搬家
img撰写博客
img发布 Chat
img专家申请
img财富坊cff888
img返回顶部