tirsdag den 12. oktober 2010

Google News hybrid anbefalinger

Tre Googlere offentliggjort et papir, \ "Personlig Nyheder henstilling Baseret på Klik Behavior \" (ACM), på det seneste IUI 2010-konferencen, der beskriver en hybrid rekommendatør system, der kombinerer bruger-baseret og indholdsbaserede anbefalinger. Denne nye hybrid rekommendatør nu synes at være indsat på Google News.

Nogle uddrag fra papiret: [Den] tidligere Google News anbefaling system blev udviklet ved hjælp af et samarbejde filtrering metode. Den anbefaler, nyhedshistorier, der blev læst af brugere med lignende klik historie. Denne metode har to store ulemper ... For det første kan systemet ikke anbefale historier, som endnu ikke er blevet læst af andre brugere ... Anden ... nyhedshistorier [at] er generelt meget populære ... konstant anbefales til de fleste af brugerne, selv for de brugere, der aldrig [er interesseret fordi] ... Der er altid nok klik ... at gøre henstilling.

En løsning på disse to problemer ville være at bygge profiler af brugerens reelle interesser og bruge dem til at gøre nyheder anbefalinger. Profilerne ... filtrere de historier, som ikke er af interesse ... [Og anbefale historier], selv om [de] ikke er blevet klikket på af andre brugere ... Baseret på en brugers nyhed læser historie, rekommendatør forudsiger emnet kategorier af interesse ... Nyhedsartikler i disse kategorier er rangeret højere på kandidatlisten.

I gennemsnit hybrid metoden ... forbedrer CTR [af] eksisterende samarbejde metode, 30,9% ... [Og øget] hyppigheden af besøg på webstedet i testgruppen [af] 14,1%. Hybrid Recommenders er ikke så nye. I fortiden, som i dette papir, de normalt var motiveret ved at forsøge at behandle de sparsity og koldstart problemer, der udfordrer kollaborative filtrering Recommenders. Hybride systemer også have været brugt til at behandle det såkaldte Harry Potter problem - anbefalinger, der fokuserer for meget på populære varer - ved at begrænse samarbejde anbefalinger til de interesser, udtrykt i profilen, selv om det ofte kan være bedre behandles af tuning et samarbejde rekommendatør at modvirke korrelationer mellem upopulære og populære emner.

En ting, der er overraskende i dette dokument er brugen af højt niveau emner i stedet for finkornet emner. Jeg vil tro, at du ville være bedre at få så konkret som muligt på profilen, så forgrener sig ud til beslægtede emner. Papiret kort behandler dette med den begrundelse, at \ "der er specialiseret i brugerprofil kan begrænse henstillinger til nyheden om, at brugeren allerede vidste \", men der synes som om det kun ville ske, hvis du hellere tåbeligt kun brugt læse emner i stedet herunder emner, der vises at være relateret til at læse emner.

Af den måde, når du har så mange data som Google skal have, er det slet ikke klart, du ønsker at falde tilbage på et indhold tilgang som de gjorde i dette dokument her. Yehuda Koren, for eksempel, har på overbevisende måde gjort gældende, at når man har store data, latent faktor modeller pakke disse indhold-relationer automatisk i langt flere detaljer og meget mere præcist end du kunne håbe på at gøre med en manuelt fremstillet model.

Endelig kan jeg ikke helt lade dette ene gå forbi uden at nævne, at Findory var en hybrid nyheder rekommendatør, der blev lanceret i januar 2004, der drejede sig om koldstart og sparsity problemer af fælles rekommendatør, de samme problemer, som Google News holdet tilsyneladende er stadig kæmper med seks år senere. Findory er ikke nævnt i dette dokument i relateret arbejde, men jeg kender Google-teamet er ganske klar over Findory.

Ingen kommentarer:

Send en kommentar

Bemærk! Kun medlemmer af denne blog kan sende kommentarer.