Kompilera kvantdatorkod med förstärkningsinlärning

Typ
Examensarbete för kandidatexamen
Bachelor Thesis
Program
Publicerad
2022
Författare
Strandby, Carl
Jacobson Mo, Nils
Lindahl, Emrik
Einarsson, Kári
Modellbyggare
Tidskriftstitel
ISSN
Volymtitel
Utgivare
Sammanfattning
Kvantdatorer förutspås kunna lösa vissa beräkningsintensiva problem som klassiska digitala datorer idag inte kan lösa inom en rimlig tidsram. Ett problem med att exekvera kvantkod är att informationen på en kvantbit har en begränsad livslängd. Det är därför viktigt att exekveringen sker med så få kvantgrindar som möjligt. Kvantdatorns kompilator är också begränsad till att endast exekvera kvantgrindar på kvantbitstillstånd som är länkade på kretsens fysiska arkitektur. Därför behöver kompilatorn tillföra SWAP-grindar för att byta plats på kvantbitstillstånden. Detta tillför exekveringstid och placeringen av dessa SWAP-grindar kan ofta göras på många olika sätt, vilket gör att det är svårt att beräkna en optimal placering. Syftet med detta kandidatarbete är därför att utforska om placering av SWAP-grindar kan utföras med en formulering av djup förstärkningsinlärning som värderar tillstånd istället för handlingar. Projektet har utförts genom att programmera en miljö för djup förstärkningsinlärning utifrån en matrisrepresentation av kvantkod och kvantkretsar. Ett artificiellt neuralt nätverk av faltningstyp har designats för att läsa in ett framtida möjligt tillstånd för en kvantkrets och värdera detta. Förstärkningsinlärningsagenten använder sedan denna värdering för att välja hur den ska placera SWAP-grindar. Förstärkningsinlärningsmodellen bygger på den öppna programvaran Stable Baseline3 som använder OpenAI Gym för miljön och PyTorch för att konstruera faltningsnätverket. Modellen användes sedan för att träna två förstärkningsinlärningsagenter för två olika storlekar av kvantkretsar. Agenterna testades sedan och lyckades med att göra en representation av kvantkod exekverbar. Deras resulterande kvantkod uppmättes dessutom endast vara något sämre än kvantbitdirigeringsprogrammet TKET. Detta antyder att värdering av kvantkretstillstånd med neurala nätverk mycket väl skulle kunna användas för att dirigera kvantbitar.
Beskrivning
Ämne/nyckelord
Djup förstärkningsinlärning , Kvantbitar , Kvantkod , Kvantkrets , Faltningsnätverk , Stable Baselines3 , OpenAI Gym , DQN , SWAP-grind , TKET
Citation
Arkitekt (konstruktör)
Geografisk plats
Byggnad (typ)
Byggår
Modelltyp
Skala
Teknik / material
Index