推广 热搜: 行业  机械  设备    经纪  教师  系统  参数    蒸汽 

竞争性关键词推荐算法设计(中南大学电子商务课程实践)

   日期:2024-11-10     移动:http://mip.xhstdz.com/mobile/quote/3853.html

        关键词广告(keyword)是一种文字链接型网络广告,通过对文字进行超级链接,让感兴趣的网民点击进入公司网站、网页或公司其它相关网页,实现广告目的。链接的关键词既可以是关键词,也可以是语句。         竞争性营销:在营销管理过程中,管理者不仅要考虑顾客的需要,还要考虑企业在本行业中的竞争地位。企业的营销战略和战术必须从自己的竞争实力地位出发,并根据自己同竞争者实力对比的变化,随时加以调整,使之与自己的竞争地位相匹配。由于现代市场营销中竞争的重要性,市场营销不仅包括“产品、价格、促销、渠道”四方面因素,还应让“竞争”成为现代市场营销的第五大因素。竞争意识要在企业的营销决策、营销规划、营销组织中充分体现出来,在营销实践中也要采取有效的策略开展竞争,不断提高企业竞争能力。

竞争性关键词推荐算法设计(中南大学电子商务课程实践)

所有关键词全集:U 广告主的种子关键词:s(s∈U) 推荐高相关性的关键词:aM(aM∈U(1)相关分析法:计算词与词之间的相关程度。 关联相关性、同义词相关性、竞争相关性等 分两类:互补性和竞争性 例如:虎牙—直播 虎牙—斗鱼 (2)方法:基于用户反馈方法、基于文本分析法、基于语义知识库,统计分析法等 (3)目的:通过了解用户搜索意图来获得KM

        通过aM来寻找相应的竞争关键词kM,构建相应的概率模型来计算关键词之间的竞争度。在这里插入图片描述         种子关键词s与任意(竞争)关键词k,存在一个中介关键词a,其与s与k都存在联合查询,即sa与ka。         度量了在所有查询ka的搜索量占a搜索量中除去sa搜索量的比例,反映了在关键词a的维度上,用户不搜索s则搜索k的概率。

(1)操作系统:Windows 10 家庭中文版。 (2)软件环境:NetBeans IDE 8.2 + JDK 1.8 + word 1.3         NetBeans是Sun公司(2009年被甲骨文收购)在2000年创立的开放源代码供开发人员和客户社区的家园,旨在构建世界级的Java IDE。         Java分布式中文分词组件 - word分词,它是一个Java实现的分布式的中文分词组件,提供了多种基于词典的分词算法,并利用ngram模型来消除歧义。能准确识别英文、数字,以及日期、时间等数量词,能识别人名、地名、组织机构名等未登录词。(word1.3需要JDK1.8(3)设计与实现:         清洗数据,获取所有关键词;compkey算法开始,输入种子关键词,如:“湖南”;接着从总搜索量中提取出与种子关键词相关的所有搜索信息;对与种子关键词相关的搜索信息进行分词与词频统计;通过对词频统计信息分析确定一定数目的中介关键词;对每个中介关键词查找相应的竞争性关键词,并计算竞争度;最后统计输出,结果保存到文件中。         中介关键词的选取:对于一个确定的种子关键词,对清洗后的数据进行提取,得到与种子关键词有关的所有的搜索量保存到文件中,使用word分词插件对该文件进行分词与词频统计,出现的次数越多说明相关性越大,权重越大,则可以选取出现频率高的词作为中介关键词。         竞争关键词的选取:每一个中介关键词都会对应一个竞争性关键词。对于每一个确定的中介关键词,从清洗后的数据中进行提取出于中介关键词有关的所有的搜索量保存到文件中,使用word分词插件对该文件进行分词与词频统计,出现的次数越多说明其与中介关键词相关性越大,则可以选取出现频率最高的词(该词不是种子关键词和中介关键词)作为竞争关键词。

(1)数据来源:…电子商务与电子政务实验数据搜狗比赛数据퇘tag_query.10W.TRAIN (2)数据特征(字段说明: ID加密后的ID age 0:未知年龄; 1:0-18岁; 2:19-23岁; 3:24-30岁; 4:31-40岁; 5:41-50岁; 6:51-999岁 Gender 0:未知 1:男性 2:女性 Education 0:未知学历; 1:博士; 2:硕士; 3:大学生; 4:高中; 5:初中; 6:小学 QueryList搜索词列表 (3)数据示例(如下图: 00627779E16E7C09B975B2CE13C088CB 4 2 0钢琴曲欣赏100首 一个月的宝宝眼睫毛那么是黄色 宝宝右眼有眼屎 小儿抽搐怎么办 剖腹产后刀口上有线头 属羊和属鸡的配吗 在这里插入图片描述

“湖南”, “作文”, “小说”, “大学”, “高考”, “诗句”, “电视剧”,“虎牙”, “广场舞”, "手机"等等。

用Java读取原数据(源码

 

数据处理之后,每个搜索记录单独占一行(如下图图2-4

        两个关键词不频繁同时出现在同一查询中,它们分别和同一关键词(中介关键词)同时出现在同一查询中的次数越多,竞争性越高;         两个关键词分别和多个相同中介关键词同时出现在同一查询中,这样的中介关键词越多,竞争性越高。

(1)通过对查询日志的搜索,提取出所有与种子关键词s同时出现的中介关键词aM。 (2)计算出所有包含s与sa的查询搜索量。 (3)对查询日志进行搜索以确定不同时与s出现,但与某一个中间关键词同时出现的竞争性关键词kM,然后计算每个竞争关键词的竞争度 代码演示

 

(1)竞争关键词的选取的不是很准确,主要体现在词性对等上。如种子关键词“虎牙”,其中介关键词“视频”对应的相关度最高的竞争关键词“在线”。 (2)当数据量增大的时候,程序运行效率低,时间主要花费在word分词上,可以考虑使用Java多线程提高效率。

        关键词广告是一类重要的互联网广告形式,关键词推荐成为了一种重要的支持广告主决策的方法,竞争性关键词推荐能达到抢占竞争对手市场的更好广告效果。通过本项目实践,使学生了解关键词推荐方法,掌握竞争性关键词测度、CompKey算法流程、以及关键词的感知竞争性的有效性评估方法,并对算法进行软件设计,能以所学的理论和方法为基础拓展相关知识,以适应参与兴型电子商务的应用与开发实践的需要。

        对同一种子关键词,选取相同数目的中介关键词和竞争关键词,随着搜索量的增加,算法运行的时间成线性增长。

        通过将搜狗比赛数据进行预处理,使处理后的实验数据可以直接作为算法的输入数据,掌握了基本的数据清洗技术,和从复杂数据中提取出对算法有用的数据,并完成了竞争性关键字测度的计算和CompKey算法的实现。 下一步可以考虑的工作(1)选取竞争关键词的策略优化可以重新,如多个中介关键词存在程度的竞争关键词的竞争性。 (2)通过并行编程提高算法运行效率。 (3)代码重构,提高可阅读性和重用性。


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


0相关评论
相关最新动态
推荐最新动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号