كاربرد بازيابي هوشمند اطلاعات در جستجوي پتنت
محورهای موضوعی : انتقال فناوري و تجاريسازي پژوهشحبیب الله اصغری 1 * , آزاده شاکری 2
1 - پژوهشکده فناوری اطلاعات و ارتباطات
2 - هیات علمی دانشگاه
کلید واژه: بازیابی هوشمند اطلاعات, بازیابی متنی, جستجوی پتنت, گسترش پرس و جو, حق ثبت اختراع,
چکیده مقاله :
در ارزیابی درخواست ثبت اختراع، جستجو در فهرست اطلاعات قبلی نقشی بسیار مهم و حائز اهمیت دارد. عموما این جستجو توسط افراد خبره انجام می شود و فرآیندی بسیار زمان بر است. جستجو از طریق روشهای مختلف بازیابی هوشمند اطلاعات می تواند نقش موثری در فرآیند بازیابی اطلاعات همسان ایفا نماید. یکی از مهمترین مسائل مرتبط با بازیابی اسناد پتنت، ایجاد یک عبارت پرس و جوی کارآمد به منظور جستجو می باشد. از جمله شیوه های ساخت عبارت پرس و جو می توان به تولید خودکار پرس و جو از تقاضانامه ثبت پتنت اشاره نمود. همچنین در روشهای دیگر، از تمامی متن سند پتنت به عنوان پرس و جو جهت اجرای جستجو استفاده می شود. نکته حائز اهمیت آن است که غالبا به دلیل نحوه خاص نگارش اسناد پتنت و ایجاد ابهامات معنایی، گسترش عبارت پرس و جو از اهمیت ویژه ای برخوردار است. در این مقاله مجموعه تحقیقات انجام شده در خصوص بازیابی اسناد پتنت با کمک الگوریتمهای بازیابی هوشمند اطلاعات در هر دو زمینه بازیابی تک زبانی و بین زبانی مورد بررسی قرار می گیرد. همچنین معیارهای ارزیابی کیفیت بازیابی و شیوه مرتب سازی اسناد بررسی می گردد.
Patents play an important role in Intellectual Property protection. So, in recent years a considerable attention has been paid to patent and prior-art search. In process of patent application filing, searching in the previous patent database is of great importance. Patent examiners search in a huge database of patents to find if there exists any similarity between applicant’s claim and the previous registered patents. This process that called patent invalidity run, is one of the important stages of patent registration. Because of legal aspects of this process, the searcher should not leave any relevant patent document. So patent searching is essentially a recall-oriented issue in information retrieval applications. In recent years, the use of intelligent information retrieval in this search process has been investigated by many researchers. In this paper we investigate various methods of information retrieval that have been proven to be effective in retrieving relevant results. The survey also has focused on query formulation and how to transform a query patent into a search query. So we have explored different factors of a successful transformation, such as how many query words should be used, where to extract query words, how to weight them and whether to use noun-phrases instead of individual words. Furthermore, the survey covers researches that combine different features and has been proven to make a significant improvement in retrieval performance.
[1] Hall, B. H. (2007). Patents and patent policy. Oxford Review of Economic Policy, 23(4), 568-587.
[2] L. Sarasúa, “Cross Lingual issues in patent retrieval” SIGIR’00, pp. 1-4, 2000.
[3] S.Verberne and E.D'hondt, “Prior art retrieval using the claims section as a bag of words”, CLEF'09, pp. 1-3, 2009.
[4] X. Xue and W. B. Croft, “Transforming Patents into Prior-Art Queries”,SIGIR’09, pp. 1-2, 2009.
[5] P. Mahdabi, M. Keikha, S. Gerani, M. Landoni, and Crestani, “Building Queries for Prior-art Search”, IRFC’11, pp. 1-14, 2011.
[6] Xiaobing Xue, and W. Bruce Croft, “Automatic Query Generation for Patent Search” CIKM’09, November 2–6, 2009, Hong Kong, China.
[7] Strohman, Trevor, Donald Metzler, Howard Turtle, and W. Bruce Croft. "Indri: A language model-based search engine for complex queries." In Proceedings of the International Conference on Intelligent Analysis, vol. 2, no. 6, pp. 2-6. 2005.
[8] H. Gurulingappa, B. Muller, M. Hofmann-Apitius, R. Klinger, H. T. Mevissen, C. M. Friedrich, J. Fluck “Prior Art Search in Chemistry Patents Based On Semantic Concepts and Co-Citation Analysis”, The Nineteenth Text REtrieval Conference (TREC 2010) Proceedings.
[9] J. Gobeill, A. Gaudinat, P. Ruch, E. Pasche, D. Teodoro, D. Vishnyakova, ” BiTeM site Report for TREC Chemistry 2010: Impact of Citations Feeback for Patent Prior Art Search and Chemical Compounds Expansion for Ad Hoc Retrieval”, The Nineteenth Text REtrieval Conference (TREC 2010) Proceedings.
[10] H. Gurulingappa, B. Müller, R. Klinger, H.-T. Mevissen, M. Hofmann-Apitius, J. Fluck and C.M. Friedrich, ”Patent Retrieval in Chemistry Based on Semantically Tagged Named Entities”, The Eighteenth Text REtrieval Conference (TREC 2009) Proceedings.
[11] Bouadjenek, Mohamed Reda, Scott Sanner, and Gabriela Ferraro. "A Study of Query Reformulation for Patent Prior Art Search with Partial Patent Applications." In Proceedings of the 15th International Conference on Artificial Intelligence and Law, pp. 23-32. ACM, 2015.
[12] Piroi, Florina, Mihai Lupu, Allan Hanbury, Alan P. Sexton, Walid Magdy, and Igor V. Filippov. "CLEF-IP 2010: Retrieval Experiments in the Intellectual Property Domain." In CLEF (notebook papers/labs/workshops). 2010.
[13] Lupu, Mihai, and Allan Hanbury. "Patent Retrieval." Foundations and Trends in Information Retrieval 7, no. 1 (2013): 1-97.
[14] W. Magdy, and Jones, G. “ A new metric for patent retrieval evaluation”. First International Workshop on Advances in Patent Information Retrieval (AsPIRe'10) at 32nd European Conference on Information Retrieval (ECIR 2010), 28 March 2010, Milton Keynes, U.K.
[15] Magdy, Walid, and Gareth JF Jones. "PRES: a score metric for evaluating recall-oriented information retrieval applications." In Proceedings of the 33rd international ACM SIGIR conference on Research and development in information retrieval, pp. 611-618. ACM, 2010.
[16] W.Magdy, P. Lopez, and G. J. F. Jones, “Simple vs. Sophisticated Approaches for Patent Prior-Art Search”, ECIR'11, pp. 1-4, 2011.