智城识别ID 119722
承接项目数 0
好评率 0%
会员 0级
总收入 ¥ 0RMB
保证金 0 RMB
拥有技能 MySQL Python
服务领域 大数据
所属地区 杭州市

团队成员

扫地哥论道2021

黄海洋 (周末和晚上兼职开发)

日薪:300元/天(8小时)
【1】Python数据分析类 1.1 做过35个数据分析中小型项目,涉及kaggle和飞桨的电商,支付,新零售,股票,生物,气象领域数据; 1.2 具备扎实的Python数据获取+数据清洗+数据整合+数据分析+数据可视化的数据分析经验(pandas,numpy,matpoltlib,seaborn,pyecharts,pyhive,pymysql,scikit-learn); 1.3 熟悉面向对象编程步骤,多线程,队列,类属性,类继承,装饰器,封装,耦合,递归,自定义函数编程;...

客户如何评价

欢迎对我的工作做出评价

承接项目列表

我还没有完成任何项目

项目经历


2020-01-01--2020-03-01 python聚合支付B端商户交易分析 数据分析师

A.数据清洗和去重,然后merge()合并表,用pivot_table按order_time,city,merchant_id,bd_name分组筛选,按payment_num,trading_volume聚合和TOP5排序分析;
B.分组聚合后分别按year-month求.sum()和按天的.cumsum()滚动交易额以及占比,用matplotlib和seaborn库,subplot展示按year-month,以及分别按city和top10_bd排名的交易总额和交易笔总数的:bar图,line图和box图以及pie图;
C.按merchant_id排名对应的交易笔数[30,100,300,500,1K,3K,5K,1W,1W+]分段正态分布图;
D.用corr(),std(),cov()分析payment_num,trading_volume与城市BD人数,销售费用,人工cost的相关性;
E. 再用Pyecharts实现交互视觉的股票式GMV折线图,overlap组合图和Page组合大屏图;


2020-04-01--2020-04-30 电商新零售客户数据分析 数据分析师

A.数据清洗,提取订单时间中的:年-月-日,去重,分析异常数据占比和特点;按月分组,销量最多的月份排序可视化bar图;
B. 按城市分组,按购买数量求和,按数量求和排序,购买商品数量前10的城市--可视化bar图;
C.计算客单价;按客户ID分组,汇总销售数量和销售额,计算用户平均消费金额和消费次数;
D. pivot_table透视表计算年度退货率;计算R-F-M值,各分位数段客户消费频次,RFM的数据类型做转换,按RFM的价值取值判断价值:高和低,各用户等级的个数统计,最后可视化用户等级情况的重要度bar图和用户等级比例pie图;


2020-05-01--2020-05-31 双十一淘宝化妆品销量信息分析 数据分析师

A.数据清洗:处理缺失值,查看sale_count和comment_count列的众数,对宝贝标题进行分词处理,将销售额作为新的一列,转换时间列格式为datetime并作为index,计算各店铺的商品数量绘制bar图,计算各店铺品牌总销量和品牌总销售额绘制bar图,根据化妆品和护肤品销量总体占比情况和子类别销量占比绘制饼图,根据各品牌各总类的总销量绘制基于seaborn的bar图;
B.根据各品牌各子类的总销量,各品牌各子类的总销售额绘制基于seaborn的bar图;根据各品牌商品的平均评论数绘制bar图,绘制各店铺价格的箱型图,绘制各品牌产品的平均价格的bar图,根据各店铺的品类销售量和销售额绘制散点图,通过基于seaborn的bar图分析男性护肤品的销量情况,最后分析11月按天统计的日销量;


2020-07-01--2020-07-31 kaggle电子游戏数据可视化分析 数据分析师

从游戏的时间序列、产品类型、发布平台以及发行商四个维度pivot_table进行透视分析,基于seaborn的每年游戏发行bar图,游戏发行商TOP10分析,游戏收入排TOP10的发行bar图,各发布平台的总销量的bar图分析;


2020-09-01--2020-09-30 广告渠道投放效果分析 数据分析师

各类广告渠道90天内日均UV,平均注册率、平均搜索率、访问深度、平均停留时长、订单转化率、投放时间、素材类型、广告类型、合作方式、广告尺寸和广告卖点等特征,将渠道分类,找出每类渠道的重点特征, 平均停留时间与访问深度corr相关性分析,Top25日均UV状况及其广告投放总时间,广告类型/卖点与平均注册率、订单转化率之间的关系;


2020-10-01--2020-10-31 电子产品深度分析&会员RFM分析 数据分析师

KA客户分析,消费人群分析&画像分析,产品分析,销量分析,订单分析,月度会员分析,用户分层,复购率与订单分析(B类客户),二次订单间隔分布分析(B类客户),会员RFM分析(B类客户);


2020-11-01--2020-11-30 某闯关类游戏的数据分析 数据分析师

按渠道效果分析:每日新增用户数、活跃用户数的同比和环比情况,活动转化率、第7日加权留存率、付费率、ARPU、ARPPU、CPL买量成本、LTV 和 ROI ;然后数值标准化处理,计算均值,标准差,标准差系数,赋予权重综合计算排名;


工作经历


2019-07-01--2023-10-22 扫地哥Python数分咨询工作室 python数据分析师

【1】Python数据分析类
1.1 做过35个数据分析中小型项目,涉及kaggle和飞桨的电商,支付,新零售,股票,生物,气象领域数据;
1.2 具备扎实的Python数据获取+数据清洗+数据整合+数据分析+数据可视化的数据分析经验(pandas,numpy,matpoltlib,seaborn,pyecharts,pyhive,pymysql,scikit-learn);
1.3 熟悉面向对象编程步骤,多线程,队列,类属性,类继承,装饰器,封装,耦合,递归,自定义函数编程;
1.4 精通4个版本的数据大屏实现:Pyecharts的overlap和Page大屏+Js版的Echarts大屏+基于Flask框架的数据大屏分析系统+基于PowerBI和Tableau的数据大屏;
1.5 【项目】B端聚合支付交易数据的python多维度数据分析,喜茶门店评价数据分析,kaggle电子游戏数据可视化分析,Iris纸鸢花数据的EDA探索分析,龙源风电数据EDA探索及分析,混泥土强度数据可视化分析,广告投放效果的数据分析,淘宝商品数据的数据挖掘与分析,基于搜索记录的用户画像分析,北京空气质量的数据建模分析,双十一淘宝化妆品销量信息的数据分析,电子产品深度分析与会员RFM模型分析,贷款申请数据的分析,财务报表的数据处理分析,用户消费行为分析和O2O消费券线下使用分析,Flask+Vue3+Mysql的前后端数据交互项目;
【2】Mysql数分类+Hive数仓类
2.1 熟练操作基于workbench和navicat 15的Mysql数据分析,并熟练基于Pycharm操作Mysql和Hive数仓;
2.2 熟练操作基于Mysql的 (企业级) 车车智能营销数据分析项目和淘宝用户行为分析SQL版项目;
2.3 熟悉Hadoop下的HDFS文件操作和Hive数据分析,熟练Hive窗口函数和分区表+分桶表+内部表+外部表;
【3】Python爬虫类
3.1 做过15个爬虫数分项目,如定时秒抢茅台,Tkinter界面爬酷我+酷狗音乐,爬淘宝+京东+小米商品数据,爬王者英雄和皮肤,爬网页动态加载数据,百度翻译JS逆向,爬知乎问答,爬豆瓣电影和评论,爬城市二手房信息;
3.2 熟悉senelium自动化爬虫和scrapy爬虫框架,熟悉图片验证码和滑块验证码及交互式验证码的破解;
3.3 熟悉JS逆向,熟悉Requests,Beautifulsoup和Xpath,以及移动端APP的基于Appium的数据爬取;
3.4 熟悉多线程爬虫;
【4】Hadoop集群和Docker虚拟化
4.1 熟练搭建windows和linux-centos7系统的伪分布式Hadoop集群,并用hive数仓-HSQL进行海量数据分析;
4.2 熟练搭建VM17下,基于linux-centos7系统,基于Docker的Hadoop和Hive搭建和部署;
4.3 熟练Docker和Git的常用命令;


教育经历


2003-09-01--2007-07-01

学校:河南财经政法大学
专业:信息管理与信息系统
学历:本科

案例

该用户目前还没有上传任何案例
No portfolio