I dati disponibili tramite la piattaforma PATIRIS si basano sulle domande di brevetto depositate a titolarità singola o congiunta dalle Università e dagli Istituti di ricerca pubblici italiani. Il rigore della scelta rispetto alla qualità dell’informazione raccolta sconta due limiti noti a chi si occupa di questo tema: la minore affidabilità delle informazioni più recenti in considerazione dei tempi tecnici di completamento delle procedure di pubblicazione delle domande; la non considerazione di brevetti a titolarità di soggetti diversi, ma che riportano come inventore un professore o ricercatore. Il primo aspetto è un tratto ineludibile legato all’uso di dati brevettuali. Il secondo comporta la risoluzione di problemi tecnici molto specifici di combinazione delle informazioni relative agli inventori e alle loro caratterizzazioni professionali.

I temi di discussione collegati alla brevettazione nelle istituzioni pubbliche sono molti e oggetto da tempo dell’attenzione di studiosi di diverse discipline, di operatori privati e di decisori pubblici. In questo progetto questi temi non sono affrontati in maniera specifica, ma ci si concentra sull’obiettivo di fornire al pubblico la base di dati necessaria a sostenere in maniera informata ed aggiornata tali studi e discussioni.

Basandosi sull’esperienza acquisita nella gestione del servizio web Patiris, online dal 2013, sui suggerimenti ricevuti dagli utenti che lo hanno utilizzato e considerando potenziali sinergie e complementarietà rispetto ai servizi offerti dagli operatori commerciali, sono state valutate le principali alternative ed è stata infine scelta come fonte dati la piattaforma Open Patent Services (OPS) fornita dall’Ufficio Europeo dei Brevetti (EPO).

OPS è un servizio web che fornisce l'accesso ai dati grezzi dell'EPO tramite un'interfaccia XML standardizzata. Le informazioni brevettuali vengono estratte dai database dell'EPO che, oltre ai dati bibliografici, danno accesso anche ai documenti full-text, alle immagini e allo status giuridico del brevetto,. Tutte le informazioni provengono dalle stesse fonti dati di Espacenet e dell’European Patent Register.

I dati presenti nell’ Europen Patent Register contengono tutte le informazioni relative alle diverse fasi del procedimento di concessione del brevetto europeo, i dati storici completi per ogni singola domanda di brevetto in qualsiasi momento. I dati del registro europeo includono non solo le informazioni elencate nella “Rule 143” dell’EPC (es. numero della domanda di brevetto europeo; la data di deposito della domanda; il titolo dell'invenzione; la classificazione assegnata; gli Stati designati etc..) ma anche dati aggiuntivi come lo stato giuridico, i dettagli relativi al rappresentante legale, etc.

Espacenet è probabilmente lo strumento di ricerca di documenti brevettuali più completo disponibile gratuitamente a livello globale. È sviluppato e fornito dall'EPO e ad oggi contiene più di 120 milioni di documenti brevettuali provenienti da oltre 100 paesi risalenti fino al 1836. In Espacent, oltre ai dati bibliografici ed ai relativi documenti brevettuali della domanda, sono presenti ulteriori dati relativi allo stato giuridico del brevetto, le eventuali citazioni e le relative famiglie di brevetto (Simple and INPADOC family) associate alla domanda.

 

Famiglie di brevetto

Con il termine famiglia di brevetti si intende generalmente un gruppo di documenti brevettuali che, come una famiglia, sono collegati fra loro. Il collegamento è rappresentato da una comune priorità. La data di priorità e il relativo numero di priorità indicato su tutti i documenti brevettuali indicano la data a partire dalla quale viene rivendicata la novità di un’invenzione e decorrono i diritti anche delle domande depositate successivamente. Generalmente la data di priorità corrisponde alla prima data di deposito nella nazione del richiedente. I documenti appartenenti ad una stessa famiglia sono detti “equivalenti” e hanno in comune uno o più numeri di priorità.

L'insieme dei brevetti che compongono una famiglia raggruppa documenti diversi che fanno capo allo stesso numero di priorità. Questo significa che nonostante una stessa invenzione sia sottoposta a discipline giuridiche differenti a seconda dei paesi in cui la domanda di brevetto viene depositata, dal punto di vista della valutazione della performance innovativa tutti i documenti di una famiglia identificano un comune prodotto della ricerca.

Nel caso delle procedure EPO per il brevetto europeo e WIPO, in relazione alle domande internazionali di brevetto, ad esempio, una singola domanda di brevetto permette di ottenere a cascata una pluralità di documenti brevettuali al fine di proteggere l’invenzione sottostante in molteplici Stati senza dover ripetere, stato per stato, tutte le singole procedure di domanda.

Esistono diversi tipi di famiglie di brevetti contraddistinte dal criterio utilizzato per raggruppare i singoli documenti brevettuali. L’utilizzo di ciascun tipo di famiglia presenta pro e contro a seconda del tipo di analisi che s’intende effettuare. L’insieme di questi aspetti rende la ricerca e l’analisi d’informazioni brevettuali attività complesse e particolarmente influenzate dalle scelte soggettive dell’analista.

Famiglie EPO

La famiglia INPADOC è definita come comprendente tutti i documenti che hanno la stessa priorità o combinazione di priorità. Questa include tutti i documenti brevettuali derivanti da una domanda di brevetto presentata come un primo deposito presso un ufficio brevetti e dalla stessa domanda di brevetto presentata entro l'anno di priorità presso un qualsiasi ufficio brevetti di un altro paese. Questo tipo di famiglia è particolarmente utile per effettuare analisi di prior art e stato legale poichè consente di trovare tutti i membri di una famiglia che sono anche solo lontanamente collegati, ma può risultare troppo ampia per il nostro obbiettivo (individuare singole invenzioni), poichè potrebbe rendere difficile trovare l'esatta relazione di un singolo documento brevettuale con un altro.

Sul fronte opposto, la famiglia EPO o famiglia semplice, che corrisponde alla definizione utilizzata nel presente progetto, in senso stretto prevede che due documenti possano essere considerati equivalenti se condividono tutti la stessa priorità; quindi, una famiglia semplice risulta essere una raccolta di documenti di brevetto che si ritiene coprano una singola invenzione ed il contenuto tecnico delle diverse domande contenute nella famiglia è considerato identico. Si tratta di un tipo di raggruppamento per invenzione molto preciso ed accurato per strategie di analisi orientate all’individuazione di prior art.

Famiglie Derwent

Le famiglie di brevetti “Derwent”, consultabili attraverso il database Derwent World Patent Index (DWPI) di Thomson Reuters, sono generate attraverso un processo di expert coding. Thomson Reuters utilizza esperti con competenze sviluppate in oltre 40 anni per creare famiglie di brevetti i cui membri hanno contenuti tecnici simili.

Famiglie FamPat

La famiglia “FamPat”, sviluppata da Questel e utilizzata nella precedente versione di Patiris, espande la regola rigida della famiglia EPO con norme aggiuntive in modo da incorporare variazioni nella definizione di invenzione di diverse autorità brevettuali (particolarmente utile per la ricerca di pubblicazioni giapponesi e statunitensi). La famiglia e il database FamPat combinano insieme tutte le fasi di pubblicazione dei documenti membri. Ricerche per assegnatario, inventor o classi sono perfezionate su tutti gli equivalenti della famiglia. Gli ID assegnati a ciascuna famiglia sono stabili nel tempo.

Famiglie IP5 OECD

Per rispecchiare meglio l'attività inventiva che i migliori performer aziendali di R&S svolgono in tutto il mondo, OECD ha introdotto nel 2015 una nuova definizione di famiglia di brevetto, le IP5 patent families che si basano su domande di brevetto depositate presso gli IP5: EPO, JPO, KIPO, SIPO e USPTO. IP5 è il nome dato a un forum dei cinque più grandi uffici di proprietà intellettuale del mondo, istituito per migliorare l'efficienza del processo di esame dei brevetti in tutto il mondo; insieme gestiscono circa l'80% delle domande di brevetto mondiali e il 95% di tutte le domande internazionali di brevetto PCT(Patent Cooperation Treaty) http://www.fiveipoffices.org/. Le famiglie di brevetto vengono prese in considerazione solo nella misura in cui sono state depositate delle domande equivalenti in almeno due uffici dove uno è un IP5. Ad esempio, i brevetti depositati presso USPTO saranno considerati solo se un deposito equivalente è stato effettuato in un qualsiasi altro ufficio brevettuale del mondo.

 

Istituti ed enti di ricerca

La realizzazione dell’osservatorio Patiris richiede di identificare tutte le famiglie di brevetti che hanno per assegnatario un’università o istituto di ricerca pubblico italiano con l'obiettivo di costruire rapporti periodici sulla brevettazione accademica. A questo scopo è stata definita un’anagrafica degli istituti monitorati che si basa sulle informazioni fornite dal Ministero dell'Università e della Ricerca. Il database definitivo contiene 98 Università, 20 enti di ricerca pubblici elencati nell'art 1 del DECRETO LEGISLATIVO 25 novembre 2016, n. 218 con l'aggiunta della " Fondazione Istituto Italiano di Tecnologia", controllato oltre che dal MIUR anche da altri ministeri, per un totale di 119 istituti.

Partendo dai nomi degli istituti, per ciascuno di essi sono stati effettuati numerosi cicli incrementali di ricerche e affinamento delle stringhe testuali per determinare gruppi di stringhe di ricerca ottimali, individuando le possibili variazioni di nome osservabili nei documenti brevettuali.

Questa attività, fondamentale per consentire nel tempo ricerche stabili e coerenti in grado di restituire sempre gli stessi risultati, si è resa necessaria poiché non esiste un codice univoco assegnato agli istituti dalle diverse autorità internazionali. Al contrario, di volta in volta, gli istituti che figurano come assegnatari vengono identificati (es. al momento dell’application) soltanto attraverso il nome e altre informazioni (es. indirizzo) codificate sotto forma di stringhe testuali. Di conseguenza, nell’effettuare ricerche basate sul nome dell’assegnatario vanno necessariamente risolti evidenti problemi di ambiguità relativi ai diversi nomi di uno stesso istituto che vengono indicati nel corso degli anni sui documenti brevettuali.

A causa, infatti, di errori di data entry, variazioni di uno stesso nome o artefatti generati durante il processo di digitalizzazione di documenti cartacei tramite tecnologia OCR, si verificano numerosi casi in cui ad uno stesso istituto corrispondono molteplici varianti dello stesso nome. Per risolvere il problema è necessario costruire per tentativi stringhe di ricerca via via sempre più complesse al fine di catturare la varietà di nomi presenti nello stock di documenti brevettuali che s’intende osservare. Senza effettuare ricerche con operatori booleani per concatenare le possibili varianti risulterebbe impossibile identificare correttamente tutti i documenti e/o famiglie di documenti potenzialmente rilevanti.


Architettura di sistema e popolamento banca dati

Come accennato precedentemente, l’Open Patent Services(OPS) di EPO è la fonte da cui vengono estratte le informazioni per popolare la banca dati PATIRIS. Partendo dalla disambiguazione dei nomi degli istituti, vengono inizialmente generate delle query per ricercare tutti i brevetti afferenti all’istituto di interesse. Ottenuti i primi dati, viene eseguita una seconda ricerca basata sui brevetti e le famiglie acquisiti nella prima fase, per ricercare tutti i brevetti facenti parte della stessa famiglia analizzata, i così detti “equivalents”. Il servizio OPS mette a disposizione delle funzionalità di ricerca molto avanzate tra cui , specificamente, la ricerca dell’insieme dei brevetti di una stessa famiglia partendo dalla conoscenza di un solo brevetto afferente alla famiglia. Tale funzionalità permette di ottenere un dato esaustivo e completo in grado di soddisfare i requisiti e gli obiettivi propri della ristrutturazione della piattaforma Patiris. Le informazioni estratte dalla banca dati EPO sono sottoposte a operazioni di normalizzazione e organizzazione al fine di popolare la piattaforma PATIRIS.

Torna all'inizio del contenuto