Pandasticsearch: An Elasticsearch client exposing DataFrame API
Elasticsearch • onesuper 发表了文章 • 0 个评论 • 6572 次浏览 • 2016-11-08 18:02
# Create a DataFrame object
from pandasticsearch import DataFrame
df = DataFrame.from_es('http://localhost:9200', index='people')
# Print the schema(mapping) of the index
df.print_schema()
# company
# |-- employee
# |-- name: {'index': 'not_analyzed', 'type': 'string'}
# |-- age: {'type': 'integer'}
# |-- gender: {'index': 'not_analyzed', 'type': 'string'}
# Inspect the columns
df.columns
#['name', 'age', 'gender']
# Get the column
df.name
# Column('name')
# Filter
df.filter(df.age < 13).collect()
# [Row(age=12,gender='female',name='Alice'), Row(age=11,gender='male',name='Bob')]
# Project
df.filter(df.age < 25).select('name', 'age').collect()
# [Row(age=12,name='Alice'), Row(age=11,name='Bob'), Row(age=13,name='Leo')]
# Print the rows into console
df.filter(df.age < 25).select('name').show(3)
# +------+
# | name |
# +------+
# | Alice|
# | Bob |
# | Leo |
# +------+
# Sort
df.sort(df.age.asc).select('name', 'age').collect()
#[Row(age=11,name='Bob'), Row(age=12,name='Alice'), Row(age=13,name='Leo')]
# Aggregate
df[df.gender == 'male'].agg(df.age.avg).collect()
# [Row(avg(age)=12)]
# Groupby
df.groupby('gender').collect()
# [Row(doc_count=1), Row(doc_count=2)]
# Groupby and then aggregate
df.groupby('gender').agg(df.age.max).collect()
# [Row(doc_count=1, max(age)=12), Row(doc_count=2, max(age)=13)]
# Convert to Pandas object for subsequent analysis
df[df.gender == 'male'].agg(df.age.avg).to_pandas()
# avg(age)
# 0 12
es 怎么去除掉 结果 _score<1的?
Elasticsearch • strglee 回复了问题 • 2 人关注 • 2 个回复 • 5926 次浏览 • 2016-11-07 21:17
org.elasticsearch.client 5.0在idea 和gradle中无法跟新
回复Elasticsearch • qijun4tian 发起了问题 • 1 人关注 • 0 个回复 • 5231 次浏览 • 2016-11-07 16:18
mysql中查询语句如何翻译成ES查询语句
Elasticsearch • Xargin 回复了问题 • 2 人关注 • 1 个回复 • 10663 次浏览 • 2016-11-07 16:20
关联搜索要求同索引,如果关联数据过多,会不会导致分片为1
回复Elasticsearch • lbeny 回复了问题 • 2 人关注 • 1 个回复 • 3774 次浏览 • 2016-11-08 21:20
elasticsearch ik分词插件 问题
Elasticsearch • medcl 回复了问题 • 3 人关注 • 1 个回复 • 2511 次浏览 • 2016-11-07 11:35
es集群规划问题
Elasticsearch • gfswsry 回复了问题 • 6 人关注 • 2 个回复 • 5456 次浏览 • 2016-11-14 19:35
如何重建索引,名称与之前索引名称一样
Elasticsearch • nb114917778 回复了问题 • 3 人关注 • 1 个回复 • 6354 次浏览 • 2016-11-08 19:28
在ES的搜索中怎么搜索出field事空字符串的的结果 是一个 “ ” 不是null
回复Elasticsearch • edwardyang6936 发起了问题 • 2 人关注 • 0 个回复 • 6265 次浏览 • 2016-11-04 17:54
logstash 写入ElasticSearch占用大量带宽
Logstash • y676360 回复了问题 • 3 人关注 • 1 个回复 • 5435 次浏览 • 2016-12-12 11:36
Elastic Advent Calendar 活动启动咯!
Advent • medcl 发表了文章 • 11 个评论 • 8027 次浏览 • 2016-11-04 13:46
今年的Advent文章也会同步发布到社区公众号。
去年 Advent 活动回顾 http://elasticsearch.cn/topic/advent
由于本站没有日历的功能,大家留言评论报名预定就好了。
格式(仅12月):日期,标题
如:12月x日 , xxx 小技巧一则
已发布:
《大规模Elasticsearch集群管理心得》
《Kibana 系漫游指南》
《创建一个你自己的 Beat》
《将sql转换为es的DSL》
《Elasticsearch 2.x mapping tips》
《无外网环境10分钟快速集成 elasticsearch-head》
《Elasticsearch 5 入坑指南》
《可定制的 elasticsearch 数据导入工具 ——mysql_2_elasticsearch》
《记一次es性能调优》
《PacketBeat奇妙的OOM小记》
《ES5.0.0 安装记录》
ES5安装x-pack授权异常
Elasticsearch • ilangge 回复了问题 • 14 人关注 • 13 个回复 • 19547 次浏览 • 2016-12-08 23:25