Come vengono progettati i feed di notizie curati dall'intelligenza artificiale

La progettazione di feed di notizie alimentati dall'intelligenza artificiale è una scienza, ma è anche un'arte diretta dall'uomo. Quantumrun Foresight non può garantire che ogni articolo raccolto dai feed AI-curation sarà perfettamente allineato con le tue priorità di ricerca. Tuttavia, fornendo a Quantumrun Foresight feedback regolari (settimanali, bisettimanali, mensili) sulla qualità della selezione, il nostro team di ricerca può continuare a ottimizzare i feed per allinearli maggiormente alle esigenze di ricerca del tuo team.

Per comprendere meglio il funzionamento del motore di curation AI di Quantumrun Foresight, abbiamo preparato la seguente panoramica degli strumenti a disposizione dei nostri ingegneri di curation. 

Fonti di alimentazione

Quantumrun indicizza i feed RSS e le timeline della home page di Twitter. Tutti gli articoli che raccogliamo devono provenire da siti Web che consentono l'accesso da altri siti Web per la raccolta di feed RSS. Quantumrun non pubblica un elenco di tutte le fonti che indicizziamo perché questo elenco è dinamico e cambia regolarmente.

Se ci sono siti Web specifici che non contengono funzionalità RSS da cui desideri che Quantumrun ottenga, ciò richiederà una soluzione ingegnerizzata separata disponibile su richiesta. 

Opzioni di ottimizzazione della piattaforma AI

Quantumrun indicizza centinaia di migliaia di articoli ogni giorno, ma importa solo collegamenti (post Signal) ad articoli/rapporti rilevanti per gli utenti di abbonamento Business ed Enterprise della piattaforma. Una volta nella piattaforma, puoi aggiungere questi segnali ai segnalibri e organizzare la ricerca dei feed in elenchi, quindi convertire i tuoi elenchi in progetti di previsione visiva.

Tuttavia, il tuo team potrebbe scoprire che desideri ricevere più risultati. Ciò può accadere se una ricerca è troppo ristretta, o troppo specifica o se non cattura abbastanza parole chiave. Fortunatamente, con alcuni semplici accorgimenti, gli ingegneri curatori di Quantumrun possono espandere facilmente i tuoi risultati.

Quantumrun può:

  • Cambia la popolarità minima
  • Affina le parole chiave correnti
  • Modifica la ricerca booleana
  • Aggiungi più parole chiave e
  • Aggiungi più fonti

 

Cambia la popolarità minima

Nelle impostazioni del filtro di Quantumrun, i nostri ingegneri possono regolare l'opzione "Popolarità minima". Questo ordina gli articoli in base alla loro popolarità sui social media. L'impostazione "molto alta" per gli articoli tende a attingere da fonti ben note e ampiamente lette, mentre le impostazioni di popolarità inferiore possono attingere da più fonti di nicchia. 

Affina le parole chiave correnti 

Gli ingegneri di Quantumrun iniziano cercando le frasi esatte, quindi proviamo a pensare attentamente alla frequenza con cui quella frase esatta verrà utilizzata all'interno di un determinato articolo di interesse per i particolari obiettivi di ricerca di un cliente. 

Incorpora la corrispondenza fuzzy

Per abbinare ortografie simili, gli ingegneri di Quantumrun possono creare un termine sfocato aggiungendo una tilde e un fattore sfocato. Per esempio,  ~colore0.3 corrisponderà sia a "colore" che a "colore". Qui il fattore fuzzy era 0.3; maggiore è il fattore fuzzy, più confuse saranno le corrispondenze.

Promuovere

Il sistema di classificazione Quantumrun fornisce contenuti pertinenti nel tuo feed e, a volte, il tuo team potrebbe voler dare la priorità ad alcune parole chiave importanti rispetto ad altre. È qui che entra in gioco il potenziamento: in pratica, il potenziamento consente al tuo team di controllare l'importanza di un termine in una ricerca. 

Per potenziare un termine, gli ingegneri di Quantumrun usano il  ^ simbolo con un fattore di spinta (dall'esponenziale di quel numero) alla fine del termine. Ad esempio, se abbiamo una ricerca che include la parola chiave "Quantistico” e vogliamo potenziare questa parola chiave, allora usiamo la query Quantico^2. Per potenziare una frase, possiamo aggiungere il modificatore di potenziamento dopo la citazione di chiusura: "informatica quantistica”^10.

Tutti i termini che non dispongono di un campo o di un potenziamento specificato per impostazione predefinita vengono cercati nei campi del titolo e del corpo del testo. E il titolo ottiene un incremento di ^25. Gli ingegneri di Quantumrun potrebbero eseguire il comportamento predefinito con il seguente termine:  (titolo:acqua^25 corpo:acqua). Questo è un booleano Or query che cerca il termine "acqua" nel campo del titolo dell'articolo con un fattore di incremento pari a 25 e nel campo del corpo senza incremento. Questo approccio classifica gli articoli con il termine nel titolo superiore a quelli che contengono il termine nel corpo.

Infine, non possiamo "potenziare negativamente" una parola chiave. 

Modifica la ricerca booleana

Potrebbe essere il modo in cui la ricerca booleana interpreta i nostri comandi. Ad esempio, se il tuo team vuole saperne di più sui chicchi di caffè biologici, gli ingegneri di Quantumrun hanno scoperto che saremo in grado di generare più articoli cercando “biologico” E "chicchi di caffè" rispetto a "chicchi di caffè biologici". Non c'è alcuna garanzia che le persone che scrivono su quell'argomento useranno quella frase esatta di tre parole.

Un'altra cosa che gli ingegneri di Quantumrun possono fare è modificare le regole che aiutano il tuo team a filtrare gli articoli in base a contenuti esterni.

  • “contengono la frase esatta”
    • Usiamo questa opzione per specificare termini o frasi esatti trovati in un articolo. 
    • Esempio: il termine esatto "acqua" corrisponde a "Acqua giù dal ponte" ma non corrisponde a "Zucchero di anguria".
    • La corrispondenza non fa distinzione tra maiuscole e minuscole.
  • “contengono parole che iniziano con”
    • Usiamo questa opzione per specificare i prefissi delle parole trovate in un articolo.
    • Esempio: il prefisso della parola "water" corrisponde sia a "Water down the bridge" che a "Watermelon Sugar".
  • "contengono testo simile alla frase"
    • Usiamo questa opzione per specificare termini di ricerca fuzzy.
    • Esempio: il termine di ricerca fuzzy "colore" corrisponde sia a "colore" che a "colore".
  • “essere condiviso con Hashtag”
    • Utilizziamo questa opzione per specificare l'hashtag con cui è stato condiviso un articolo su Twitter. Gli hashtag devono corrispondere esattamente, sebbene non facciano distinzione tra maiuscole e minuscole.
  • "provenire da un dominio Web che termina con"
    • Lo usiamo per specificare il suffisso di dominio sotto il quale è ospitato un articolo. Questa regola è utile per specificare da quale tipo di siti web vogliamo raccogliere i feed consigliati. Possiamo, ad esempio, limitare la ricerca ai siti web americani inserendo ".ca" in questa regola con a Mosto applicazione. Oppure possiamo escludere gli articoli da un sito Web specifico inserendo il dominio Web in questa regola con a Non devi applicazione.
  • "corrispondenza query avanzata"
    • Lo usiamo per specificare regole avanzate per la corrispondenza dei contenuti. La sezione successiva sulla sintassi delle query avanzate fornirà tutti i dettagli.

Sintassi di query avanzata

Ecco alcune opzioni avanzate disponibili per individuare i nostri feed.

I caratteri jolly

Le tue parole chiave possono includere una serie di varianti. Ad esempio, potresti voler saperne di più sulla vernice, quindi oltre a "paint", gli ingegneri di Quantumrun possono anche cercare "paints", "painter", "painters", "painting" e "paintings", che renderebbero netti più articoli. È possibile utilizzare una ricerca con caratteri jolly per ridurre la duplicazione semplicemente utilizzando il file * simbolo. Ad esempio, la query colore* cercherebbe tutto quanto sopra. 

raggruppamenti 

Le parentesi consentono agli ingegneri di Quantumrun di creare query con logica nidificata. Ad esempio, per cercare contenuti che devono contenere "informazioni" o "tecnologia", gli ingegneri di Quantumrun dovrebbero includere il seguente termine: (tecnologia dell'informazione).

Specificatori di campo

Gli identificatori di campo consentono agli ingegneri di Quantumrun di interrogare un particolare campo in un articolo. Se gli ingegneri di Quantumrun non specificano un campo, il termine verrà abbinato al titolo dell'articolo e ai campi del corpo del testo.

I seguenti campi sono disponibili per la ricerca:

  • Il corpo cerca solo nel corpo dell'articolo. Esempio: per trovare articoli che hanno il termine "mela" nel corpo del testo, entrano gli ingegneri di Quantumrun corpo: mela come uno dei termini della query.
  • Il dominio corrisponde al suffisso del dominio nell'URL dell'articolo. Gli ingegneri di Quantumrun lo utilizzano per trovare articoli da un determinato dominio Web, ad esempio per il filtraggio geografico. I domini sono interpretati da destra a sinistra. Questo potrebbe essere inaspettato. Quindi, per abbinare qualsiasi dominio ".uk", gli ingegneri di Quantumrun devono semplicemente entrare dominio: regno unito.
    • Esempio 1: per abbinare gli articoli del dominio Web che terminano con ".com.au", inserisci dominio: com.au
    • Esempio 2: per abbinare gli articoli di un dominio Web specifico, inserisci dominio:quantumrun.com.
  • L'estratto ricerca solo i primi 300 caratteri nel corpo del testo dell'articolo. A volte, la ricerca in questo campo anziché nell'intero corpo eliminerà i risultati rumorosi poiché i termini più importanti si trovano generalmente all'inizio di un articolo. Esempio: per cercare articoli che contengono il termine "content marketing" all'inizio del corpo del testo, inserisci estratto: "content marketing"
  • Hashtag trova gli articoli che sono stati condivisi su Twitter con questo hashtag. Esempio: per trovare articoli condivisi su Twitter con l'hashtag "#beyonce", inserisci quanto segue: hashtag: beyoncé.
  • Il titolo cerca solo nel titolo dell'articolo. Esempio: per trovare articoli che contengono il termine "tè verde" nel titolo, gli ingegneri di Quantumrun inseriscono il titolo del termine di ricerca: "tè verde"

Aggiungi più fonti

Gli ingegneri di Quantumrun potrebbero includere più fonti per espandere la rete lanciata da Quantumrun. Gli ingegneri di Quantumrun possono creare nuove raccolte di feed in tre modi: tramite feed RSS, tramite la sequenza temporale di Twitter o tramite un OPML importare. 

Gli ingegneri di Quantumrun potrebbero includere siti specifici nelle tue raccolte di feed tramite i loro feed RSS o attingere da articoli condivisi dal tuo stream Twitter. L'opzione Home Timeline di Twitter è particolarmente utile perché scegli attentamente i leader di pensiero e gli influencer da seguire. Invece di provare a scorrere l'intera sequenza temporale di Twitter, Quantumrun può far emergere tutti gli articoli condivisi dagli account seguiti dal tuo team.

Le Lingue

Per ora, Quantumrun limita la nostra cura ai soli contenuti in inglese. Tuttavia, se c'è interesse a curare contenuti provenienti da fonti non inglesi, ciò è fattibile con la tua collaborazione. Ad esempio, dovremmo tradurre parole chiave pertinenti e creare un elenco di siti Web stranieri da cui vorresti che raccogliessimo contenuti. Ciò richiederebbe la configurazione di un servizio a pagamento e non può essere incluso durante la prova gratuita.

Condividi questo post:

Rimani in contatto

Post correlati