直告拥有7000多万手机许可用户的数据库。广告主可以根据用户数据库的用户地域、爱好、行业、收入、性别、年龄等属性实现精准广告投放。根据数据库中属性的来源,提供两套属性描述体系供客户在投放广告时使用。
数据库中的内容一部分是获得用户许可的数据,主要通过与网站、手机销售商、金融机构及各地运营商合作获得。
一套是原始属性,是数据库中真实拥有的数据;另一套是导出属性,导出属性中的部分数据根据原始属性推理得出。对于导出属性,文档最后给出推理依据。对许可用户,其导出属性为数据库中的真实属性记录。
原始属性
原始数据包括地域、卡类型、手机型号、用户兴趣
1)地域分布
注:根据手机号所在号段,可以查询出所属地域。
广东 41.0%
上海 9.0%
山东 8.0%
浙江 8.0%
江苏 7.0%
北京 6.0%
福建 3.0%
陕西 2.0%
河北 2.0%
湖南 2.0%
其他 12.0%
2)卡类型分布
全球通 44.4%
动感地带 24.3%
神州行 20.4%
联通GSM 8.6%
联通CDMA 2.3%
3)手机型号及价格分布(表中列出各品牌典型型号)
手机价格 |
占总数百分比 |
诺基亚 |
Moto |
索爱 |
三星 |
波导 |
其他 |
5000以上 |
6% |
8800/N91
(2.3%) |
E680i
(1.1%) |
P910C
(0.9%) |
SGH-P308/SGH-P858
(0.1%) |
|
(0.7%) |
3000到5000 |
19% |
7380/7710/9300
(5.4%) |
A1200
(3.6%) |
K790C
(2.8%) |
SGH-i539/SGH-M339/MITS M500
(2.1%) |
DOEASY X8
(1.4%) |
(3.7%) |
1500到3000 |
48% |
6111/6125/6131/6170
(18.3%) |
A728/A780/A860
(10.2%) |
K510C/K750C
(8.5%) |
SGH-E728/SGH-E708
(4.5%) |
DOEASY E868
(2.1%) |
(4.4%) |
1500以下 |
27% |
1600/2300/2600
(8.2%) |
A668/C115/C117
(5.8%) |
J100C/J210C
(2.0) |
SCH-128/SGH-218
(2.4%) |
A120/A130
(3.5%) |
(5.1%) |
4)用户兴趣分布
注:用户兴趣是根据用户上网的浏览习惯分析得出,一个用户平均有1到4个主要兴趣。
文学 26.7%
汽车 35.0%
读书 21.3%
理财 17.6%
饮食 27.5%
教育 8.7%
体育 10.5%
房产 9.0%
健康 5.7%
交友 10.6%
军事 5.6%
IT 10.7%
旅游 11.8%
金融 10.6%
娱乐 4.89%
游戏 8.7%
其他 3.21% (用户还具有上述之外其他兴趣)
导出属性
1)地域分布
广东 40.0%
浙江 8.0%
上海 9.0%
江苏 7.0%
山东 8.0%
北京 7.0%
福建 3.0%
陕西 2.0%
河北 2.0%
湖南 2.0%
其他 12.0%
2)年龄分布
分为大、中、小三个年龄段,分别大约在30岁以上,20到30,20以下
大 37.8%
中 45.7%
小 14.2%
不确定 2.3%
3)性别分布
男性 65.9%
女性 30.4%
不确定 3.7%
4)收入分布
分为高、中、低三个档次,高收入大约在3000元/月以上,中等收入在3000到1000元/月左右,低收入为1000元/月以下。
高 57.3%
中 30.6%
低 7.6%
不确定 4.5%
导出属性推理依据
利用原始数据作为推理条件,并对推理结果进行电话调查,对每个属性推理结果,随机抽取2000名用户作为样本,进行电话调查验证推理结果的准确性。
1)性别分布
根据手机UA和用户兴趣两个属性推理出用户性别。UA和用户兴趣权重分别为0.85和0.15。根据两个属性分别推理出的倾向及权重确定最终结果,如果考虑权重后的两个倾向明显不一致,则认为性别不确定。
电话调查结果误差4.2%。
- 手机UA 不同性别的人群对手机功能及外观要求不同,根据不同型号手机的特点,可以将手机分为男性、女性及中性三类。根据手机型号的各个属性,包括功能、色彩、外观曲线、长度、宽度、厚度等,结合男性女性的不同偏好,对每个型号的手机进行性别定位。初步将用户分为男性、女性和不可判断三种。
- 用户兴趣 男性和女性上网用户兴趣不同,男性比较偏重于游戏类、体育类、汽车类等内容,女性偏重于饮食、健康类等内容。根据上网用户兴趣将用户分为男性和女性用户。
2)年龄分布
根据手机UA、用户兴趣和卡类型推理,权重分别占0.30,0.25和0.45。根据三个属性分别推理出的倾向及权重确定最终结果,如果考虑权重后的三个倾向明显不一致,则认为年龄不确定。
电话调查结果误差3.7%。
- 手机UA 根据不同型号手机在当时市场上的价格不同,将手机化分为不同的档次,年龄偏大和偏小的用户用的手机档次比较低,中等年龄的用户手机档次比较高。
- 用户兴趣 年龄偏小的用户上网时主要关心娱乐、游戏等;年龄中等的用户上网主要关心娱乐、体育、读书等;年龄偏大的用户主要关心财经、房产等。
- 卡类型 年龄偏小的用户动感地带卡比较多;年龄中等的用户用神州行比较多;年龄偏大的用户全球通比较多。
3)收入分布
根据手机UA、用户兴趣、卡类型,将收入分为高、中、低三个档次;三者权重分别为0.40,0.10,0.50。根据三个属性分别推理出的倾向及权重确定最终结果,如果考虑权重后的三个倾向明显不一致,则认为收入不确定。
电话调查结果误差5.6%。
- 手机UA 不同型号的手机购买时价格不同,根据价格分为高中低三个档次;
- 用户兴趣 高收入的人群比较关注商务信息;中等收入和低收入的人群比较关注娱乐、交友等。
- 卡类型 高收入的人群主要使用全球通卡,中等收入人群主要使用神州行、动感地带和联通卡;低收入人群主要是动感地带卡。
用户数据更新机制
数据更新主要涉及到对原始属性中用户手机的型号、兴趣的更新。主要采用与WAP网站合作的方式获取最新的用户数据。
- 我们与WAP网站合作,为其用户提供增值服务。在提供服务中,识别到数据库中的用户访问网站时,可以得到其手机型号。同时跟踪用户的浏览习惯,根据其浏览和使用网站的内容,对其兴趣属性进行修正;
- 对数据库中的许可用户,参照许可用户的数据更新机制;
- 得到原始属性的更新后,每隔半月根据原始属性更新一次导出属性。
|