Kompilera kvantdatorkod med förstärkningsinlärning
Publicerad
Typ
Examensarbete för kandidatexamen
Bachelor Thesis
Bachelor Thesis
Program
Modellbyggare
Tidskriftstitel
ISSN
Volymtitel
Utgivare
Sammanfattning
Kvantdatorer förutspås kunna lösa vissa beräkningsintensiva problem som klassiska digitala
datorer idag inte kan lösa inom en rimlig tidsram. Ett problem med att exekvera
kvantkod är att informationen på en kvantbit har en begränsad livslängd. Det är därför
viktigt att exekveringen sker med så få kvantgrindar som möjligt. Kvantdatorns kompilator
är också begränsad till att endast exekvera kvantgrindar på kvantbitstillstånd som är
länkade på kretsens fysiska arkitektur. Därför behöver kompilatorn tillföra SWAP-grindar
för att byta plats på kvantbitstillstånden. Detta tillför exekveringstid och placeringen av
dessa SWAP-grindar kan ofta göras på många olika sätt, vilket gör att det är svårt att
beräkna en optimal placering. Syftet med detta kandidatarbete är därför att utforska om
placering av SWAP-grindar kan utföras med en formulering av djup förstärkningsinlärning
som värderar tillstånd istället för handlingar.
Projektet har utförts genom att programmera en miljö för djup förstärkningsinlärning
utifrån en matrisrepresentation av kvantkod och kvantkretsar. Ett artificiellt neuralt
nätverk av faltningstyp har designats för att läsa in ett framtida möjligt
tillstånd för en kvantkrets och värdera detta. Förstärkningsinlärningsagenten
använder sedan denna värdering för att välja hur den ska placera SWAP-grindar.
Förstärkningsinlärningsmodellen bygger på den öppna programvaran Stable Baseline3
som använder OpenAI Gym för miljön och PyTorch för att konstruera faltningsnätverket.
Modellen användes sedan för att träna två förstärkningsinlärningsagenter för två olika
storlekar av kvantkretsar. Agenterna testades sedan och lyckades med att göra en representation
av kvantkod exekverbar. Deras resulterande kvantkod uppmättes dessutom endast
vara något sämre än kvantbitdirigeringsprogrammet TKET. Detta antyder att värdering
av kvantkretstillstånd med neurala nätverk mycket väl skulle kunna användas för att
dirigera kvantbitar.
Beskrivning
Ämne/nyckelord
Djup förstärkningsinlärning, Kvantbitar, Kvantkod, Kvantkrets, Faltningsnätverk, Stable Baselines3, OpenAI Gym, DQN, SWAP-grind, TKET