下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

用数据分析大家最喜欢什么类型的抖音视频

作者:课课家教育     来源: http://www.kokojia.com点击数:1086发布时间: 2019-04-24 17:19:55

标签: 大数据数据分析数据结构

用数据分析大家最喜欢什么类型的抖音视频

 数据分析是基于商业目的,有目的的进行收集、整理、加工和分析数据,提炼有价信息的一个过程。其过程概括起来主要包括:明确分析目的与框架、数据收集、数据处理、数据分析、数据展现和撰写报告等6个阶段。

之前有个朋友提到了抖音数据的获取。

问我这样的行业前景如何,说实话我哪知道啊...

不过也算是给我提供了一些分析思路,感谢。

所以本次就来分析一下抖音的那些大V们。

来探索一下什么样的视频在抖音里最受欢迎。

这里不得不吐槽一下抖音,体验越来越差。

从一开始的打开App没广告,再到现在启动页面有广告,刷视频也有广告,还有商品橱窗的存在。

当然这只是吐槽一下而已,其实无论什么产品,广告必不可少~

否则,日子估摸着一天比一天难过。

或许,某一天我的公众号也会出现广告...

一、获取分析

信息肯定不是去抖音获取的,而是从某平台爬取的。

具体的就不透露了,万一哪天被查水表了该怎么办。

主要包含了大V们的昵称、性别、类型、点赞数、粉丝数以及视频数。

一共有2840位抖音大V,粉丝数都是50w+。

二、数据可视化

01 性别分布情况

2000多位大V,除去未知性别的,男女比例基本在「1:1」。

可视化代码如下。

  1. def create_gender(df): 
  2.     ""
  3.     性别 
  4.     ""
  5.     df = df.copy() 
  6.     df.loc[df.gender == 0, 'gender'] = '未知' 
  7.     df.loc[df.gender == 1, 'gender'] = '男性' 
  8.     df.loc[df.gender == 2, 'gender'] = '女性' 
  9.     gender_message = df.groupby(['gender']) 
  10.     gender_com = gender_message['gender'].agg(['count']) 
  11.     gender_com.reset_index(inplace=True
  12.  
  13.     # 生成饼图 
  14.     attr = gender_com['gender'
  15.     v1 = gender_com['count'
  16.     pie = Pie("抖音大V性别分布情况", title_pos='center', title_top=0) 
  17.     pie.add("", attr, v1, radius=[40, 75], label_text_color=None, is_label_show=True, legend_orient="vertical", legend_pos="left", legend_top="%10"
  18.     pie.render("抖音大V性别分布情况.html"

02 点赞数TOP10

点赞数都是过亿的存在,就问你怕不怕。

其中「浙有正能量」和「人民日报」这两个都是属于弘扬中国正能量的。

泱泱大中华,复兴在当下,国强则无惧,龙行在天涯。

可视化代码如下。

  1. def create_likes(df): 
  2.     ""
  3.     点赞数 
  4.     ""
  5.     df = df.sort_values('likes', ascending=False
  6.     attr = df['name'][0:10] 
  7.     v1 = ["{}".format(float('%.1f' % (float(i) / 100000000))) for i in df['likes'][0:10]] 
  8.  
  9.     # 生成柱状图 
  10.     bar = Bar("抖音大V点赞数TOP10(亿)", title_pos='center', title_top='18', width=800, height=400) 
  11.     bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False
  12.     bar.render("抖音大V点赞数TOP10.html"

03 粉丝数TOP10

粉丝数前十,大部分大V都是娱乐圈的。

这也是当下所流行的~

可视化代码如下。

  1. def create_fans(df): 
  2.     ""
  3.     粉丝数 
  4.     ""
  5.     df = df.sort_values('fans', ascending=False
  6.     attr = df['name'][0:10] 
  7.     v1 = ["{}".format(float('%.1f' % (float(i) / 10000))) for i in df['fans'][0:10]] 
  8.  
  9.     # 生成柱状图 
  10.     bar = Bar("抖音大V粉丝数TOP10(万)", title_pos='center', title_top='18', width=800, height=400) 
  11.     bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False
  12.     bar.render("抖音大V粉丝数TOP10.html"

04 各类型点赞数汇总分布图

 

「蓝V」「娱乐」「生活」「美女」「搞笑」「帅哥」「音乐」这些类型的抖音视频,应该算是在抖音里较受欢迎的。

蓝V是抖音上的一个认证方式,主要是针对企业。

从上面可以看出大部分是媒体这一块,内容则主要是一些时事以及那些正能量视频。

可视化代码如下。

  1. def create_type_likes(df): 
  2.     ""
  3.     类型点赞数 
  4.     ""
  5.     dom = [] 
  6.     likes_type_message = df.groupby(['type']) 
  7.     likes_type_com = likes_type_message['likes'].agg(['sum']) 
  8.     likes_type_com.reset_index(inplace=True
  9.     for name, num in zip(likes_type_com['type'], likes_type_com['sum']): 
  10.         data = {} 
  11.         data['name'] = name 
  12.         data['value'] = num 
  13.         dom.append(data) 
  14.  
  15.     # 生成矩形树图 
  16.     treemap = TreeMap("各类型抖音大V点赞数汇总图", title_pos='center', title_top='5', width=800, height=400) 
  17.     treemap.add('各类型抖音大V点赞数汇总图', dom, is_label_show=True, label_pos='inside', is_legend_show=False
  18.     treemap.render('各类型抖音大V点赞数汇总图.html'

05 各类型粉丝数汇总分布图

 

「娱乐」类型大V的粉丝数遥遥领先,位居第一。

其次便是「美女」「生活」「音乐」「帅哥」「文化」「蓝V」类型的。

结合一下点赞数的数据,我们就能知道在抖音里什么样的视频大家比较喜欢。

便是「娱乐」「生活」「美女」「帅哥」「音乐」「蓝V」这几个类型。

可视化代码如下。

  1. def create_type_fans(df): 
  2.     ""
  3.     类型粉丝数 
  4.     ""
  5.     dom = [] 
  6.     fans_type_message = df.groupby(['type']) 
  7.     fans_type_com = fans_type_message['fans'].agg(['sum']) 
  8.     fans_type_com.reset_index(inplace=True
  9.     for name, num in zip(fans_type_com['type'], fans_type_com['sum']): 
  10.         data = {} 
  11.         data['name'] = name 
  12.         data['value'] = num 
  13.         dom.append(data) 
  14.  
  15.     # 生成矩形树图 
  16.     treemap = TreeMap("各类型抖音大V粉丝数汇总图", title_pos='center', title_top='5', width=800, height=400) 
  17.     treemap.add('各类型抖音大V粉丝数汇总图', dom, is_label_show=True, label_pos='inside', is_legend_show=False
  18.     treemap.render('各类型抖音大V粉丝数汇总图.html'

06 视频粉丝点赞三维度图

 

视频越多并不意味着点赞数就越多,粉丝数就越多。

不过还是会有个例出现,比如「浙有正能量」,1744个视频,4.6亿点赞数。

可视化代码如下。

  1. def create_scatter(df): 
  2.     ""
  3.     三维度散点图 
  4.     ""
  5.     # 生成数据列表 
  6.     data = [list(i) for i in zip(df['videos'], df['fans'], df['likes'], df['name'])] 
  7.  
  8.     # 生成散点图 
  9.     x_lst = [v[0] for v in data] 
  10.     y_lst = [v[1] for v in data] 
  11.     extra_data = [v[2] for v in data] 
  12.     sc = Scatter("抖音大V视频数粉丝数点赞数三维度", title_pos='center', title_top='5', width=800, height=400) 
  13.     sc.add("", x_lst, y_lst, extra_data=extra_data, is_visualmap=True, visual_dimension=2, visual_orient="horizontal", visual_type="size", visual_range=[0, 500000000], visual_text_color="#000", visual_range_size=[5, 30]) 
  14.     sc.render('抖音大V视频数粉丝数点赞数三维度.html'

07 平均视频点赞数TOP10

 

第一居然被一个珠宝商给霸占了,我觉得肯定有猫腻。

于是便去抖音看了一眼。

 

 

鬼知道它的粉丝和点赞数怎么来的。

或许和圈内的删库一样,小哥删视频跑路了。

可视化代码如下。

  1. def create_avg_likes(df): 
  2.     ""
  3.     平均点赞数 
  4.     ""
  5.     df = df[df['videos'] > 0] 
  6.     df.eval('result = likes/(videos*10000)', inplace=True
  7.     df['result'] = df['result'].round(decimals=1) 
  8.     df = df.sort_values('result', ascending=False
  9.     attr = df['name'][0:10] 
  10.     v1 = df['result'][0:10] 
  11.  
  12.     # 生成柱状图 
  13.     bar = Bar("抖音大V平均视频点赞数TOP10(万)", title_pos='center', title_top='18', width=800, height=400) 
  14.     bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False
  15.     bar.render("抖音大V平均视频点赞数TOP10.html"

08 平均视频粉丝数TOP10

 

妥妥的娱乐圈大佬。

反正我是一个没关注,你们呢?

可视化代码如下。

  1. def create_avg_fans(df): 
  2.     ""
  3.     平均粉丝数 
  4.     ""
  5.     df = df[df['videos'] > 0] 
  6.     df.eval('result = fans/(videos*10000)', inplace=True
  7.     df['result'] = df['result'].round(decimals=1) 
  8.     df = df.sort_values('result', ascending=False
  9.     attr = df['name'][0:10] 
  10.     v1 = df['result'][0:10] 
  11.  
  12.     # 生成柱状图 
  13.     bar = Bar("抖音大V平均视频粉丝数TOP10(万)", title_pos='center', title_top='18', width=800, height=400) 
  14.     bar.add("", attr, v1, is_convert=True, xaxis_min=0, yaxis_label_textsize=12, is_yaxis_boundarygap=True, yaxis_interval=0, is_label_show=True, is_legend_show=False, label_pos='right', is_yaxis_inverse=True, is_splitline_show=False
  15.     bar.render("抖音大V平均视频粉丝数TOP10.html"

三、总结

我们常说,刷抖音就是浪费时间。

讲道理,抖音上也是有不少技术流的大佬,当然内容上更趋向于视频制作。

比如下面这几位,鼎鼎大名的「黑脸V」。

所以,抖音也并不是一无是处。

如果哪天你也能学会制作出那些吊炸天的视频,也是一种收获。

当然路很长,慢慢走~

 数据分析是指通过分析手段、方法和技巧对准备好的数据进行探索、分析,从中发现因果关系、内部联系和业务规律,为商业目提供决策参考。到了这个阶段,要能驾驭数据、开展数据分析,就要涉及到工具和方法的使用。其一要熟悉常规数据分析方法,最基本的要了解例如方差、回归、因子、聚类、分类、时间序列等多元和数据分析方法的原理、使用范围、优缺点和结果的解释;其二是熟悉1+1种数据分析工具,Excel是最常见,一般的数据分析我们可以通过Excel完成,后而要熟悉一个专业的分析软件,如数据分析工具SPSS/SAS/R/Matlab等,便于进行一些专业的统计分析、数据建模等。


赞(23)
踩(0)
分享到:
华为认证网络工程师 HCIE直播课视频教程