以下为《基于专利共被引方法的技术聚类分析_以***专利为例_王某某》的无排版文字预览,完整内容请下载
2014年第5期 /基于专利共被引方法的技术聚类分析/ 基于专利共被引方法的技术聚类分析 ——以***专利为例 王某某1,2 ,刘 趁1,2 ,毛某某1,2 (1. XX理工大学 公共管理与*** WISE实验室,XX 116085; 2. **_*,XX 116085) 摘要:***,专利作为企业技术能力的重要表征,同时也为人们提供了对企业技术研 究唯一的信息源。***在电子和通讯行业占据着重要地位,其专利技术代表着行业的研究前沿。 基于德温特专利数据库,本研究以***发表专利为研究对象,进行专利共被引网络分析,识别苹 果公司的主要技术聚类和关键性技术。 关键词:专利共被引;德温特;***;技术聚类;专利计量;技术挖掘 中图分类号:G353.1 文献标识码:A DOI:10.3969/j.issn1003-8256.2014.05.006 1 引言 专利作为技术能力的表征,其中包含企业的关 键性技术。由于市场竞争的激烈,企业必须以专利的 形式维护自身的利益,但是这些又是以公开企业的关 键技术为代价的。据世界知识产权组织的报告,专利 信息包含了全球R&D产出的90%以上,剩下的体现在 5%-10%的科学文献上[1]。因此,专利和文献就成为了 技术研究的重要数据来源。 国外关于专利的研究主要集中在:(1)通过专 利共被引关系研究技术的进化结构[2]。(2)专利评价 指标体系的构建[3]。主要是分析用于商业目的的专利 指标。(3)专利技术转化研究。主要包括高校间的技 术转化模式和国际技术转移及原因[4-5].(4)专利技术 预见研究。主要通过提出一些新的方法如应用文献计 量方法[6]、预测算法[7]、随机专利引文分析法[8]等。专 利的研究也不断受到国内科研工作者的重视,在CNKI 上,我们以关键词“专利”检索到13872条结果。以 “专利引用”为关键词检索,得到41条结果,这些研 究主要集中在:(1)专利引用过程中的知识的产生、 传播与流动[9-11]。(2)专利资源的引用与企业间的 关系[12-13]。(3)技术力量指标的构建[14]。(4)专利 引用在知识管理研究中的应用[15]。但是以“专利共被 引”为关键词检索,检索结果为4条。研究主要集中 在:专利权人共被引[1, 16-17]、某一领域内相关技术共被 引[18]。在专利计量的方法方面,主要还是以专利统计 分析为主,关于专利引用网络、专利共被引分析、专 利文本挖掘的研究并不多见。 本文选择在电子和通讯行业处于前沿地位的苹 果公司为研究对象,利用德温特专利数据库中专利数 据,构建被引专利间的共被引矩阵。利用社会网络分 析的方法,构建专利共被引网络。通过相应的德温特 基金项目:国家自然科学基金项目(***)、国家社会科学基金项目(14BTQ030) 作者简介:王某某(1982-),男,湖南XX人,副教授,研究方向:科学计量与科技管理;刘某某(1990-),女,XX XX人,硕士研究生,研究方向:科学计量与科技管理。 31 /科学学与科学计量学/ 手工代码分析,对***的主要技术构成、关键性 技术进行研究。 2 数据来源与分析方法 2.1 数据来源 2.1.1 数据检索 本研究的数据来源于德温特创新专利引文索引 数据库(Derwent Innovations IndexSM)。它收录了从 1963年以来42个专利机构授权的1460多万项基本发明 和3000多万条专利,每周更新,是全球最大的专利文 献数据库。该数据库为研究人员提供世界范围内电 子、电气及通讯等多个技术领域内综合全面的发明信 息,是检索全球专利的最权威的数据库。德温特数据 库不仅提供以专利权人、专利发明人、主题词为检索 的入口,还提供快速查找相关手工代码(MC)和分类 代码(DC)的检索框。德温特数据库对专利申请量较 多的专利权人都分配一个唯一的代码,如appy为苹果 公司专利权人代码。 本研究以“ae=apple inc or ae=apple computer inc or ae=appy”为检索词,检索从1963年至2014年*** 的专利,共检索到10519篇专利。其中Apple Inc.为苹 果公司现有名称,Apple Computer Inc.为2007年更名前 的公司名称。 2.1.2 数据处理 我们用perl语言将专利中的引用文献删除,然后 利用CiteSpace软件的数据转换功能[19],将专利数据转 换为web of science的数据格式,因为很多处理数据的 软件都是基于web of science数据格式的。Citespace软件 可以将PubMed, arXiv, ADS等格式转换为Web of Science 的数据格式[20],我们用Bibexcel[21]和Ucinet[22]软件处理 转换后的数据,选取206条被引频次大于50的专利分 析。专利被引频次分布如表1所示。 表1 专利被引频次分布 Table 1 The distribution of patent cited frequency 序号 1 2 3 被引频次 279 258 205 专利号 US*** US***21 US***53 4 198 US***91 5 190 US*** 6 180 US*** 7 176 US*** 8 169 US*** 9 153 US*** …… …… …… 206 51 US*** 2.2 分析方法 2.2.1 专利共被引分析方法 作为文献计量学中的一种主要手段,Small提出 的共被引分析主要是通过构建共被引次数矩阵,对作 者、期刊等进行聚类分析和社会网络分析[1]。将共被 引分析的方法应用与专利分析中,主要体现共同被引 的专利之间的技术关系,即作为技术基础的某些参 考专利之间的技术联系。通过专利共被引相关群的分 析,表示专利共被引群体网络的结构,揭示技术的相 互关系、联系特征等。 2.2.2 专利共被引的Jaccard系数矩阵 我们将表1中206个被引专利频次表通过Bibexcel软 件转换为206*206的专利共被引矩阵如表2所示,矩阵 中值表示两篇专利共同被引用的频次,矩阵为对称矩 阵。 US***05 US***41 US***84 …… US***59 表2 专利共被引次数矩阵 Table 2 Patent co-cited number matrix US***05 US***41 US***84 0 48 52 48 52 …… 0 51 …… 51 0 …… 32 34 33 …… …… …… …… …… …… US***59 32 34 33 …… 0 32 2014年第5期 /基于专利共被引方法的技术聚类分析/ Leydesdorff认为,Jaccard系数比Salton余弦系数更 适合计算共被引强度或共现强度矩阵[23]。据此,我们 修正为专利共被引矩阵强度的Jaccard系数如式(1)所 示。 (1) S(i,j)表示专利i和专利j共同被引用的强度,coc(i,j) 表示专利i和专利j共被引的次数,cit(i)和cit(j)分别表示 专利i、j的被引频次。 我们用Jaccard系数公式(1)将表2的专利共被引 矩阵标准化处理后得到专利共被引强度矩阵,如表3所 示。Jaccard系数值的范围在(0,1)之间,值越大说明 i和j的共性越多,相似性越大。为了方便在网络中的 调节我们将Jaccard系数统一乘以10000得到专利共被引 Jaccard系数矩阵如表3所示。 US***05 US***41 US***84 …… US***59 表3 专利共被引Jaccard系数矩阵 Table 3 Patent co-cited Jaccard matrix US***05 US***41 US***84 0.00 6857.14 7878.79 6857.14 0.00 7611.94 7878.79 7611.94 0.00 …… …… …… 3764.71 4096.39 3928.57 …… …… …… …… …… …… US***59 3764.72 4096.39 3928.57 …… 0.00 2.2.3 共被引网络和Girvan-Newman算法的子网络 将表3的专利共被引的Jaccard系数矩阵导入 netdraw软件,通过调整阈值得到结构清晰的最XX通 网络。用Girvan-Newman算法得到专利共被引的子网 络,该算法能够将联系紧密的节点聚集到一个子网络 中,而子网络间的联系比较松散[24]。 2.2.4 中介中心度的应用 我们采用中介中心度(betweenness centrality)的 网络计量指标寻找网络中的关键技术。中介中心度是 指网络中的行动者作为中介者的能力[25]。Burt的结构 洞理论认为,中介中心度测量的是行动者对资源的 控制程度[25-26]。中介中心性高的节点连接不同的子网 络,在子网络之间起桥梁性作用。中介中心度高的节 点代表的技术往往具有集成、带动和辐射作用,能够 培育新的增长点[27]。因此,我们用中介中心度寻找苹 果公司的关键技术。 3 结果分析 将Jaccard系数矩阵导入netdraw生成专利共被引网 络,因为只要两个专利之间存在共被引关系,共被引 强度就大于0,两节点之间就会存在连线,这些导致 网络的结构不够清晰。因此,我们调节阈值,阈值越 大,进入网络的节点间的关系强度越大,网络中节点 和连线数越少,网络结构越清晰。但是阈值过大,会 导致有效信息的缺省,因此在保证最XX通网络的基 础上,我们将从大到小调节阈值。为了使大部分节点 进入网络,我们调节阈值为14%,即如果两个专利共 被引的Jaccard系数大于14%,我们就认为这两个专利 间存在较强的共被引关系,两结点间就存在连线。否 则,就不存在连线。在Netdraw中我们用网络连线的粗 细表示共被引强度的强弱,节点大小表示中介中心度 大小。最后用Girvan-Newman算法对大型网络聚类得 到专利共被引网络如图1所示。 这个网络可以明显的分为几个主要的技术聚类。 因为德温特手工代码表示的技术领域更为详细,因 此,我们随机抽取每个聚类中的10个专利,对其德温 特手工代码分析,得出每个聚类主要代表的技术为: (1)音频、视频传输与同步技术 (2)触屏技术 33 /科学学与科学计量学/ (3)用户界面管理和视觉效果技术 (4)处理器与存储器相关技术 (5)通信技术 在图1中,我们设置了较大的阈值,只有专利间 共被引强度很大时才能产生连线,这时网络中连接的 只有第一类(音频视频传输与同步技术)和第二类 (触屏技术)两个大类。我们可以发现第三类(用户 管理界面与视觉效果)和第四类(处理、存储器)没 有和其他类发生联系。由大到小调节阈值,更多节点 和连线进入网络,当阈值为10%时,第三类(用户管 理和视觉效果技术)通过屏幕技术节点与触屏技术产 生了联系(如图2所示)。进一步调小阈值,当阈值为 9%时,第四类(存储器和处理器技术)通过同步技术 与处理、存储技术节点与第一类(音频、视频传输与 同步技术)间出现连线(如图3)。继续减小阈值,直 到阈值为0,第五类(通信技术)未与网络中其他类发 生联系。 图1 专利共被引网络图(阈值为14%) Figure 1 Patent co-cited network(cutoff is 14%) 34 2014年第5期 /基于专利共被引方法的技术聚类分析/ 图2 专利共被引网络(阈值为10%) Figure 2 Patent co-cited network(cutoff is 10%) 图3 专利共被引网络(阈值为9%) Figure 3 Patent co-cited network(cutoff is 9%) 35 /科学学与科学计量学/ 产生以上现象的原因,可以从以下几个方面解 释: (1)第一类(音频视频传输与同步技术)和第 二类(触屏技术)属于***的基本技术构成,苹 果公司的产品,如:ipod(音乐播放器)和iTunes(数 字媒体播放应用程序))基本都是以这两项技术为基础 的,因此,这两类在整个网络中结构比较稳定。 (2)随着基础技术的发展,人们对用户界面的 友好性和视觉效果要求不断增加,因此,***在 触屏技术的基础上不断完善第三类(用户界面和视觉 效果技术)。 (3)在同步技术和音频、视频传输发展的同 时,对处理器和存储器的要求也在提高,为了实现第 一类(同步技术和音频、视频传输)的发展,必须以 更强大的处理器和存储器(第四类)为支撑。因此, 第三类和第四类专利作为主要技术的扩展和支撑连接 强度不大。 (4)第五类(通信技术)作为***的主要 技术构成,并未与其他技术类产生联系。 4 结论 本文以在科技领域处于创新先驱地位的*** 为研究对象,通过专利共被引分析,分析共被引专利 类所属的技术领域,从而探测***的主要技术构 成以及关键性技术,主要得到以下结论:专利共被引 网络可以***的基础技术构成。从***专利 共被引的网络中可以发现,***主要由:音频、 视频传输与同步技术、触屏技术、用户界面和视觉效 果技术、处理器和存储器、通信技术这五项基础技术 组成。通过专利共被引网络中节点的中介中心性可以 ***的关键技术。根据Burt的结构洞理论,我们 探测到***的关键性技术,即中介中心度大的节 点所属的技术领域为:音频、视频播放与传输技术, 其次为触屏技术和同步技术。未来,我们将在本研究 的基础上,开发出专门化的专利计量研究工具,从而 可以方便地实现对一个企业或者领域的专利计量研 究。 参考文献: [1]王某某,刘某某,侯海燕.基于专利共被引的企业技术发展与 技术竞争分析:以世界500强中的工业企业为例[J].科研管 理,2010,(4):127-138. [2] Xianwen Wang, Xi Zhang, Shenmeng Xu. Patent Co-citation Networks of Fortune 500 Companies[J]. Scientometrics,2011, 88(3):761-770. [3] Lanjouw J O, Schankerman M. Patent quality and research productivity: Measuring innovation with multiple indicators[J]. The Economic Journal,2004,114(495):441-465. [4] Nagaoka S. Does strong patent protection facilitate international technology transfer? Some evidence from licensing contracts of Japanese firms[J]. The Journal of Technology Transfer, 2009,(34):128-144. [5] Mark O. Sellenthin. Technology transfer offices and university patenting in Sweden and Germany[J]. The Journal of Technology Transfer, 2009,(34):603-620. [6] Daim T U, Rueda G, Martin H,et al. Forecasting emerging technologies: Use of bibliometrics and patent analysis[J]. Technological Forecasting and Social Change, 2006,73(8):981-1012. [7] Yoon B, Park Y. Development of new technology forecasting algorithm: Hybrid approach for morphology analysis and conjoint analysis of patent information[J]. IEEE Transactions on Engineering Management,2007,(3):588-599. [8] Lee C, Cho Y , Seol H,et al. A stochastic patent citation analysis approach to assessing future technological impacts[J]. The Journal of Technology Transfer,2012,79(1):16-29. [9] 杨某某,梁某某,刘某某.专利引用过程中的知识活动探析[J].科 研管理,2010,(2):171-177. [10]向希尧,蔡某某.组织间跨国知识流动网络结构分析——基于专 利的实证研究[J].科学学研究,2011,(1):97-105. [11]杨某某,刘某某,于霜.基于专利引文网络的技术领域间关系探 析[J].科研管理,2011,(5):149-155. [12]李某某,宣国良.战略联盟的资源基础理论实证研究[J].情报科 学,2005,(7):961-965. [13] 张某某,王某某,刘某某,侯海燕. 基于专利计量的企业技术相似 性网络测度研究[J]. 情报杂志,2011,(1):90-93. [14]杨某某,孙某某.基于专利引用的国家技术力量指标比较[J].科 学学与科学技术管理,2005,(10):11-14. [15]向希尧,蔡某某.基于专利引用的社会网络分析在知识管理研究 中的应用[J].管理学报,2012,(4):562-569. [16]张某某.基于专利共被引网络的世界500强企业技术分析[D].大 连理工大学,2011. 36 2014年第5期 /基于专利共被引方法的技术聚类分析/ [17]黄某某.基于专利共被引矩阵的物联网技术分析[J].中小企业 管理与科技(上旬刊),2013,(9):293. [18]尹某某,殷某某,刘某某.中国数字信息通讯技术前沿演进的可 视化研究[J].科研管理,2010,(6):36-40. [19]Chen CM. CiteSpace II: Detecting and visualizing emerging trends and transient patterns in 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 ny, patents offer the unique information resource for studying the corporate technologies in the fierce market competition. Apple inc plays an important role in electronic and communications industries, patens of Apple company are the research front of the electronic industry. We detect the major technology and significant clusters from the co-citation networks using the Derwent database. Keywords:Patents co-citation;Derwent;Apple inc;Technology clustering;Patentometrics;Technology mining 37 [文章尾部最后500字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。
以上为《基于专利共被引方法的技术聚类分析_以***专利为例_王某某》的无排版文字预览,完整内容请下载
基于专利共被引方法的技术聚类分析_以***专利为例_王某某由用户“wld0077”分享发布,转载请注明出处