Hur ser framtidens Internet ut?

Ofta när jag tar upp den tekniska utvecklingen och vad som väntar de närmaste åren möts jag av förvåning. Väldigt få har en bild av vart Internet är på väg och varför. I Silicon Walley finns däremot tydliga visioner om framtiden och jag tänkte därför på ett lite mer systematiskt sätt beskriva vad som kommer att hända med Internet och varför.

Till att börja med - utvecklingen drivs av en ständigt ökande datorkapacitet. Datorernas kapacitet fördubblas på 24 månader. Nu har vi nått en gräns i processorfrekvens och tillväxten kommer att ske genom fler parallella processorer. Det kommer att göra det nödvändigt att bygga datorerna mer som den mänskliga hjärnan - med redundanta och parallella processer.

Men i stor sett lär Moores lag fortsätta gälla. Det innebär en fördubbling av beräkningskapaciteten vartannat år. Den kapaciteten kommer att användas för att förbättra vår upplevelse och troligen för att bygga en helt parallell värld.

Internet i dagens form är ofullständigt. Webbsidorna är begränsade till att visas på en fyrkant (bildskärm) som oftast är tvådimensionell. Ljudet är i regel stereo, vilket inte spelar så stor roll då det som händer på nätet ändå händer inom nämnda fyrkant.

Våra sinnen har dock möjlighet att uppfatta mycket mer än bara ljud framifrån och grafik som är begränsad till en fyrkant. I den verkliga världen - utanför Internet - kan vi höra om någon kommer bakifrån. Vi kan även placera ett ljud i vertikal riktning - vi hör omedelbart om något händer ovanför huvudet eller nere på marken. Skälet till att vi kan göra det är att ljudvågorna förändras på ett specifikt sätt när de träffar ytterörat. 

Det går att efterlikna dessa ljudförändringar på ett sätt som gör att ljudet som kommer från ett par hörlurar verkar komma från en viss plats i rummet. Detta är något mer än stereo och brukar kallas "spatialt ljud". Tekniken används bland annat i VR-set, eftersom det där är viktigt att få en korrekt uppfattning om varifrån ljudet kommer - till exempel om en zombie närmar sig bakifrån.

Nyttan med spatialt ljud är dock inte särskilt stor om synfältet är begränsat till en stationär fyrkant i mitten av synfältet. Då bör ju allt ljud komma från fyrkanten. 

Det är här som VR-glasögonen kommer in. Att täcka in hela det mänskliga synfältet kräver hög datorkapacitet, så dagens så kallade HMD:er (Head Mounted Displays) begränsar sig till 120 grader. Det ger en viss tunneleffekt och synfältet kommer i takt med att datorkapaciteten ökar säkert att blir större. Samtidigt krävs det en ökning av upplösningen - här uppstår en konkurrens mellan olika önskvärda kvalitetsförbättringar.

En vanlig missuppfattning är att dagens begränsande faktor är upplösningen på VR-glasögonen. Men så är det inte. Det är datorernas grafikkort som måste bli snabbare. VR-glasögonen har en ganska god upplösing om man använder de fusk som brukar användas i grafikkort - som supersamling med mera. Dock orkar inte grafikkorten riktigt med denna teknik. Det som vill köra VR bör därför alltid köpa det snabbaste grafikkortet som finns på marknaden.

Syftet med VR-glasögonen är att skapa en bildskärm som täcker 360 grader och renderas i tre dimensioner. När detta sedan kombineras med spatialt ljud får vi i praktiken en audiovisuell kopia av den verkliga världen. Nu är det bara att fylla den världen med innehåll.

Tekniken för att skapa den världen finns redan i stor utsträckning, eftersom datorspelsindustrin nästan sedan starten varit tvungna att arbeta i tre dimensioner för att kunna återge en korrekt bild i två dimensioner. Det finns färdiga verktyg för att skapa representationer av människor och föremål i en tredimensionell värld. Ett sådant verktyg är Unity.

Sätter man ihop allt detta - 360 3D, spatialt ljud och mänskliga avatarer har vi något som i förlängningen liknar The Matrix - om ni sett filmen. För att nå dit på det audiovisuella planet - så att det blir svårt att skilja mellan den verkliga världen och den simulerade - måste vi antagligen fördubbla eller tredubbla upplösningen på våra HMD:er, samt öka synfältet till 230 grader. Detta kräver att vi renderar en tredimensionell värld i grafikkort som är minst tio gånger så snabba som dagens - kanske mer än så. Om Moores lag gäller ännu tar det sju år.

När vi når den nivån på grafikkorten lär headseten vara trådlösa och lätta som ett par skidglasögon. Långt innan den dagen kommer en stor del av vår mänskliga interaktion att ha flyttat till virtuella världar. Redan primitiva sociala verktyg som Facebook och Twitter klarar av att fånga vår uppmärksamhet på ett helt oväntat sätt. Vad kommer då att hända när de sociala nätverken blir verkligheten? Ingen Facebookvän är längre bort än en knapptryckning.

High Fidelity är sociala nätverk på steroider. Den öppna programvaran som utvecklas av Philip Rosedale, även skapare av den virtuella världen Second Life, bygger på tanken om att varje människa lika gärna kan representeras av en tredimensionell avbild - en avatar. I Silicon Walley finns redan prototyper för en avtarskapare. Den fungerar som en vanlig fotoautomat där man går in för att skapa en elektronisk kopia av sig själv. Väl inne i automaten (man får av anständighetsskäl behålla underkläderna på) scannas kroppen till en tredimensionell representation i form av en .obj eller .fbx - två vanliga filformat för tredimensionella objekt.

För att man ska kunna röra sig i den virtuella världen lämnas utrymme för att man kan röra ben, armar, huvud och fingrar på det sätt som människor kan i verkligheten. Det stor fördelen med avataren - jämfört med om man skulle föra över en tredimensionell bild på riktigt - är att datorerna endast behöver föra över positionen för vissa nyckelpunkter. I det enklaste fallet kan det vara positionen för huvudet, armarna och benen. Det kräver dock inte speciellt mycket mer information för att även föra över information om ögonen, fingrarna och alla andra positioner som kroppens 218 ben tillåter att vi intar.

Om man inte förändrar sitt utseende radikalt på kort tid - och de flesta gör inte det - spelar det ingen praktisk roll om man ser en verklig person eller en avatar framför sig. Kan man inte se någon skillnad är det ingen skillnad. Om man nu inte sträcker ut handeln för att försöka ta på avataren. Då går armen bara rakt igenom.

Ljudet har Rosedale redan fått till bra i High Fidelity. Med hjälp av världsledande ljudteknik har han lyckats matcha avatarernas position med deras tal via så kallade HRTF (Head Related Transfer Functions). Via artificiell intelligens får han läpparna på avatarerna att röra sig på ett naturligt sätt. Ögonen blinkar och även om pupillerna inte spåras av headsetet (ännu) får man god kontakt med de andra avatarerna. Man upplever närvaro, kort uttryckt.

Ljudet är ett eget kapitel. Det går att läsa mer om hur ljudet måste processas för att ge ett verklighetsnära intryck här. Men tekniken ligger i frontlinjen och en av de stora utmaningarna är att varje avatars ljud och utseende måste processas både på användarens dator och alla andra användares datorer för att minimera behovet av bandbredd. Därigenom att den upplevda skillnaden i ljud kunnat minimeras så att man på ett obehindrat sätt kan ha en konversation i en grupp på kanske tio personer eller anordna en koncert där åhörarna kan sjunga med. Lite om hur arbetet med att ta ner fördröjningen gick till går att läsa här.

Det kanske mest intressanta med High Fidelity är projektets ambitionsnivå. Philip Rosedale har byggt världen helt i Open Source och uppmuntrar användare att sätta upp egna servrar som motsvarar dagens webbservrar. Han har planer på att införa en virtuell valuta och High Fidelity har ett eget protokoll som motsvarar de traditionella http:// eller https://. Kort sagt: Ambitionen är att ersätta dagens Internet med ett nytt och mer kraftfullt protokoll.

Skillnaden mellan att klicka på en vanlig webblänk och en länk i High Fidelity är stor. Klickar man på en HiFi-länk, till exempel hifi://ekonomism, förflyttas man till en virtuell värld där det går att umgås med andra avatarer. Man kommer givetvis även att kunna läsa texter, titta på journalfilmer eller annat som man kunde även på 1900-talet. Länkarna kommer givetvis inte att se ut som dagens länkar, utan mer som en transporter från Star Trek om ni har sett serien. Går man in i transportern förflyttas man automatiskt till en annan server och därmed en annan värld.

Röstbaserad kommunikation kommer i stor utsträckning att ersätta tangentborden och dagens missförstånd mellan Siri och användaren kommer att bli betydligt färre. Informationsinhämtning kommer att gå snabbare då syn- och hörselintryck effektivare kan användas för att skapa minnesbilder. I den mån text alltjämt används för att skapa precision i kommunikationen kan den kompletteras med visuella intryck som gör att informationen fastnar. Design och konstnärlig förmåga uppvärderas när syftet blir att fånga användarnas uppmärksamhet via många sinnen samtidigt - inte bara via bokstäver, ord och meningar.

Den som äger servern bestämmer givetvis som ska finnas där. Själv planerar jag att sätta upp en server för vetenskapliga föreläsningar. Men först ska jag försöka lära mig lite om hur man använder programmet Blender för att bygga tredimensionella världar. Att flytta objekt och göra enklare justeringar går direkt i HiFi-interfacet. Ska man skapa mer komplicerade strukturer kan det däremot vara bra att ha en 3D-editor.

Denna översikt hoppas jag svarar på frågan om vart Internet är på väg. Nätet är på väg att ta över stora delar av vår tillvaro - rent bokstavligt. Vi är på väg från en begränsad visuell vy på en bildskärm till en tredimensionell värld i 360 grader. Vi är på väg från endimensionellt ljud till tredimensionellt ljud. Internet är på väg att bli en digital representation av vår existerande värld eller - om vi vill - en alternativ värld med upplevelser som av olika skäl inte är möjliga i den vanliga världen.

Jag vill inte gå så långt som att påstå att vi är på väg att avskaffa den vanliga världen, men jag låter det vara öppet hur stor del av vår vakna tid som vi kommer att tillbringa i respektive värld. Skulle inte utesluta att vi inom en rätt nära framtid kommer att tillbringa mer tid i den digitala världen än i den fysiska.

Kommentarer till detta inlägg