Memomics paplašināšana — Bjeweled informācijas Babilonas datu ieguve:

By | marts 21, 2022

Memomics, ja to saprot kā mēmu izpēti, dekodējot to ontoloģiskā kartēšanā, ir vērtīgs rīks semantisko tīklu un meklētājprogrammu uzlabošanai. Tirdzniecības un reklāmas lietojumprogrammas, ko veicina mākslīgie intelektuālie aģenti, var gūt labumu no atrastajām korelācijām, kā tas tiks paskaidrots tālāk:

Saskaņā ar Wikipedia mēmi ir termins, kas apzīmē idejas vai uzskatus, kas tiek nodoti no vienas personas vai cilvēku grupas citai. Nosaukums cēlies no analoģijas: Tā kā gēni pārraida bioloģisko informāciju, var teikt, ka mēmi pārraida informāciju par idejām un pārliecību. Memome var uzskatīt par visu mēmu kolekciju. Ja mēs mazliet iedziļināmies šajā jēdzienā, var arī teikt, ka tas ietver visas cilvēku zināšanas.

Genomika un proteomika ir attiecīgi genoma, organismu iedzimtās informācijas kopuma un visu tā proteīnu komplementa izpēte. Tāpat Memomics var uzskatīt par Memome izpēti, visu mēmu kolekciju.

Genomikā un proteomikā pētījums ietver dažāda veida gēnu un proteīnu funkciju un struktūru “kartēšanu”. Kartēšana, piemēram, var būt vai patoloģiska, ti, korelācija starp noteiktu gēnu un proteīnu ekspresijas profiliem ar slimībām, vai arī tā var būt topoloģiska: izteiksme attiecībā uz noteikta veida audiem, šūnu tipu vai orgānu.

Tāpat Memomics pēta ideju un terminu ontoloģisko kartēšanu. Uzņēmums Alitora systems ir spēris pirmos soļus Memomics jomā un uzminiet, kur viņi ir sākuši: ar dzīvības zinātņu datiem. Viņi ir izstrādājuši ērtus datu un teksta ieguves rīkus, kas var paātrināt jēgpilnu meklēšanu un nodrošina saites uz lielāko daļu ontoloģiski korelētu jēdzienu.

Vērienīgāks projekts būtu visu cilvēku zināšanu pilnīga ontoloģiskā kartēšana. Tas nozīmē, ka katram esošajam terminam vai jēdzienam jāatrod, ar kādiem jēdzieniem tas ir dabiski saistīts. Ar to es domāju ne tikai semantiskās kartēšanas nodrošināšanu, kas sniedz termina nozīmi pazīmēs un citos terminos. Es vēlētos paplašināt kartējumus, kā ieteikts manā iepriekšējā rakstā: “Minervas pūces lido tikai krēslas laikā — nepārprotami inteliģentas ontoloģijas”. Tas ir, lai kartētu tuvuma attiecību katram terminam, kas definēts semantiskajā tīmeklī, vienam otram terminam, kas tāpat definēts, lai zinātu vidējo attālumu starp šiem terminiem visos dokumentos visā globālajā tīmeklī un šādu notikumu biežuma svaru. Šāda ontoloģijas karte varētu atrast terminus, kuriem ir sastopamības korelācija, kas ir krietni virs “trokšņa”. Daudzas triviālas terminoloģijas bieži sastopamas tuvu jebkuram virtuālam terminam. Tas veido trokšņa frekvences līmeni, kas ir slieksnis, kas ir jāpārsniedz ievērojamām termiņu korelācijām. Šāda terminoloģija ietver visa veida sintaktiskos terminus, piemēram, saikļus, apstākļa vārdus, īpašības vārdus, modālos darbības vārdus utt.

Pārāk augsta sliekšņa noteikšanas trūkums ir tāds, ka terminiem, kas parasti ir triviāli, kombinācijā ar citu terminu var būt ļoti specifiska nozīme.

Ja šī ontoloģiskā kartēšana tiek veikta tikai noteiktās segmentētās klasēs/nozīmes laukos, pēkšņi var rasties svarīgas korelācijas, kuras nebija redzamas lielākajā daļā klašu un lauku.

Tādējādi šādu ontoloģisko tuvuma kartēšanu ar svērto sastopamības biežumu varētu veikt kombinācijā ar “vietņu klasifikāciju” (i-taksonomija).

Un otrādi, ontoloģiskās tuvuma kartēšanas izmantošana ar svērto sastopamības biežumu varētu nodrošināt klases un apakšklases. Tāpēc šo procesu var īstenot iteratīvā veidā. Nozīmīga korelācija var radīt klases, kuras savukārt var iegūt datus, lai atrastu jaunus kartējumus un ieteiktu jaunas apakšklases.

Vēl viena ontoloģiska kartēšana ir noteikt, vai noteiktām saitēm tīmeklī ir korelācija ar noteiktiem terminiem.

Ieviešana jāsāk ar visu informāciju, kas noteiktā datumā ir pieejama tīmeklī. Šī informācija ir kaut kādā veidā jāsaglabā kā iesaldēta, lai īstenotu plašo datu ieguves uzdevumu tuvuma kartēšanai. Kad dotā Memome ir pilnībā atšifrēta, procesu var atkārtot iteratīvi ar papildinājumiem, un tas galu galā panāks tobrīd esošo “tagadni”.

Mākslīgie inteliģentie aģenti veiks ontoloģiskās kartēšanas procesu un mācīsies no atpazītajiem modeļiem, atvieglojot nākotnes notikumu kartēšanu un turpmāku klašu izveidi. Turklāt šādi pamanītās un/vai ģenerētās saites, kas tiek izmantotas biežāk, var pievienot attiecīgajiem centrmezgliem sistēmā “Hubbit”, par ko es runāju savā iepriekšējā rakstā: “No meklētājprogrammām līdz centrmezglu ģeneratoriem un centralizētām personiskām daudzfunkcionālām interneta saskarnēm”. Labi izplatītas saites tiks dotas priekšroka, un nenozīmīgas saites nenonāks pastāvīgā stadijā saskaņā ar evaņģēlisko sakāmvārdu: “Tam, kam ir, tiks dots, kam nav, tas tiks atņemts”, kas arī ir laba metafora tam, kā mūsu smadzenēs tiek izveidotas neironu saites.

Lai īstenotu tik milzīgu projektu, būtu nepieciešams milzīgs skaitļošanas jaudas un atmiņas apjoms, un tas joprojām var pārsniegt tehniski iespējamo. Tas ir trūkums. Taču datoru skaitļošanas jauda un atmiņa daudzu gadu desmitu laikā ir pieaugusi eksponenciāli, un nav pamata uzskatīt, ka nepieciešamā tehnoloģija nav tuvu sasniedzama.

Lietojumprogrammas un komerciālās priekšrocības ir daudz.

Tērzēšanas robotus un citas lingvistiskās sistēmas var uzlabot, mācoties no šīm korelācijas kartēm. Meklētājprogrammas var uzlabot, parādot rezultātus ranžējumā saskaņā ar tuvuma kartēšanu ar svērto biežumu. Meklēšanas apakšā var būt ieteikumi “cilvēki, kuri meklēja šos vienumus, meklēja arī …”.

Komerciālus ontoloģiskos kartējumus var izveidot, ja termini ir saistīti ar visiem uzņēmumiem, kas iesaistīti ar šo terminu saistīto produktu tirdzniecībā. Tāpat kā Alitora sistēmas ir kartējušas, kā daži ar slimībām saistīti gēni ir saistīti ar uzņēmumiem, kas izstrādā zāles pret šīm slimībām, izmantojot mehānismu, kas ietver saistīto gēnu, proteīnu vai vielmaiņas ceļu.

Tādējādi varētu arī izveidot Commerce Memome (Commercome) kā meklējamu datu bāzi: visu komerciālo attiecību kopums, ti, produkti, kas saistīti ar pārdevējiem, pircēju ražotājiem utt. Commerics kartētu attiecības ontoloģiskā veidā. Kad šāds informācijas tīkls būs izveidots, tas būs kļuvis par ļoti noderīgu un vienkāršu veidu, kā identificēt jūsu konkurentus un jaunpienācējus šajā jomā (ar nosacījumu, ka sistēma tiek atjaunināta).

Reklāma varētu gūt lielu labumu no šādām korelācijas kartēm. Līdzīgi ieteikumiem formā “cilvēki, kas meklēja šos terminus, meklēja arī ..” uz ontoloģijas kartēšanu balstītu tehnoloģiju varētu izmantot reklāmā: Tas ir, pamatojoties uz to pašu principu, līdzīgi tam, kas notiek komerciālās vietnēs, piemēram, Amazon.com: “cilvēki, kas nopirka A, nopirka arī B”, bet evolūcijas un mācīšanās algoritmā pārsniedz šo principu. Piemēram, reklāmas izmaksas varētu būt saistītas ar klikšķināšanas biežumu uz attiecīgās reklāmas (PPC reklāma), vienlaikus ar to saistīt arī reklāmas rādīšanas biežumu. Tādā veidā atkal paklausot principam “kam ir, tam tiks dots, kam nav, tiks atņemts”. Cita komerciālu datu un teksta ieguves kartēšana varētu ietvert reklāmas klikšķu biežuma kartēšanu atbilstoši noteiktiem meklēšanas vienumiem. To var arī savienot ar sistēmu, kas saista reklāmas izmaksas ar klikšķu biežumu un/vai rādīšanas biežumu. Atkal AIbot, kas nodrošina šīs funkcijas, mācītos no konteksta un pielāgotu informācijas parādīšanu atbilstoši kontekstam. Atkal AIbot ģenerētu klases un iegūtu specifiskākas korelācijas no ģenerētajām apakšklasēm.

FAQ lapas varētu palīdzēt šādi AIbots, kas, vēlams, spēj sarunāties dabiskā valodā kā tērzēšanas robots. No atbildēm un jautājumiem un lietotāju apmierinātības rezultātiem šādus robotus varētu ieprogrammēt, lai tie mācītos un kļūtu par efektīvākiem informācijas sniedzējiem.

Tādējādi Memomics var tikt paplašināts, lai kļūtu par vērtīgu dzinēju, lai iegūtu informācijas dārgakmeņu Babilonas datu dārgakmeņus.

Atbildēt

Jūsu e-pasta adrese netiks publicēta.