scaluq は、量子回路シミュレータ Qulacs をもとに再開発された、新しい Python/C++ ライブラリです。 大規模な量子回路、ノイズを伴う量子回路(未実装)、パラメトリック量子回路の高速シミュレーションを実行することができます。 本ライブラリは、MITライセンスの下で公開されています。
Qulacs に比べ、以下の点が改善されています。
- Kokkos をベースとした実装により、実行環境(CPU/GPU) の切り替えを容易に行うことができます。切り替えの際にコードを変更する必要はありません。
- よりよい実行速度を実現します。
- ポインタをユーザから隠蔽したことにより、より安全に、簡単に記述できます。
- nanobind の導入により、よりコンパクトかつ高速な Python へのバインディングを実現します。
- 複数の量子状態に対して同じ回路を適用させるようなケースに対して、より高速なインターフェースを提供します(未実装)。
- Ninja 1.10 以上
- GCC 11 以上 (CUDAを利用しない場合13以上)
- CMake 3.21 以上
- CUDA 12.6 以上(CUDA利用時のみ)
- Python 3.9 以上 (Python利用時のみ) ※これより低いバージョンでも動作する可能性はありますが確認していません
- CUDA 12.6 以上(CUDA利用時のみ) ※これより低いバージョンでも動作する可能性はありますが確認していません
ビルド時のオプションをscript/configure
やpip install .
実行時の環境変数で指定できます。
変数名 | デフォルト値 | 意味 |
---|---|---|
CMAKE_C_COMPILER |
- | See CMake Document |
CMAKE_CXX_COMPILER |
- | See CMake Document |
CMAKE_BUILD_TYPE |
- | See CMake Document |
CMAKE_INSTALL_PREFIX |
- | See CMake Document |
SCALUQ_USE_OMP |
ON |
CPUでの並列処理にOpenMPを利用するか |
SCALUQ_USE_CUDA |
OFF |
GPU (CUDA)での並列処理を行うか |
SCALUQ_CUDA_ARCH |
(自動識別) | CMAKE_USE_CUDA=ON の場合、ターゲットとなるNvidia GPU アーキテクチャ (名前はKokkos CMake Keywordsを参照、例: SCALUQ_CUDA_ARCH=AMPERE80 ) |
SCALUQ_USE_TEST |
ON | test/ をビルドターゲットに含める。ninja -C build test でテストのビルド/実行ができる |
SCALUQ_USE_EXE |
ON | exe/ をビルドターゲットに含める。インストールせずに実行を試すことができ、ninja -C build でのビルド後、exe/main.cpp の内容をbuild/exe/main で実行できる。 |
SCALUQ_FLOAT16 |
OFF | f16 精度を有効にする |
SCALUQ_FLOAT32 |
ON | f32 精度を有効にする |
SCALUQ_FLOAT64 |
ON | f64 精度を有効にする |
SCALUQ_BFLOAT16 |
OFF | bf16 精度を有効にする |
scaluq を静的ライブラリとしてインストールするには、以下の一連のコマンドを実行します。
git clone https://github.com/qulacs/scaluq
cd scaluq
script/configure
sudo -E env "PATH=$PATH" ninja -C build install
- 依存ライブラリのEigenとKokkosも同時にインストールされます
CMAKE_INSTALL_PREFIX
を設定することで/usr/local
以外にインストールすることもできます。ユーザーローカルにインストールしたい場合や、別の設定でビルドしたKokkosと衝突させたくない場合は明示的に指定してください。例:CMAKE_INSTALL_PREFIX=~/.local script/configure; ninja -C build install
- ビルドしたものを
/usr/local/bin
に配置するためsudo
コマンドを用いていますが、ビルド時の環境変数をユーザーのものにするため例では-E
とenv "PATH=$PATH"
を指定しています。 - NVIDIA GPU と CUDA が利用可能ならば、
SCALUQ_USE_CUDA=ON
を設定してconfigureすることでCUDAを利用するライブラリとしてインストールできます。例:SCALUQ_USE_CUDA=ON script/configure; sudo env -E "PATH=$PATH" ninja -C build install'
オプションを変更して再ビルドする際には、CMake にセットされたキャッシュ変数をクリアするため、必ず以下のコマンドを実行してください。
rm build/CMakeCache.txt
インストール済みのscaluqを利用したプロジェクトでのCMake設定例をexample_project/に提示しています。
Python のライブラリとしても使用することができます。
pip install scaluq
GPUを利用する場合やf32
f64
精度のサポートが必要な場合は、リポジトリをクローンしたのちにオプションを指定してインストールします。
git clone https://github.com/qulacs/scaluq
cd ./scaluq
SCALUQ_USE_CUDA=ON pip install .
Python ライブラリとしてインストールした際の、関数の説明や型の情報がまとめられている、簡易的なドキュメントを用意しています。以下のリンクから確認できます。 https://scaluq.readthedocs.io/en/latest/index.html
#include <iostream>
#include <cstdint>
#include <scaluq/circuit/circuit.hpp>
#include <scaluq/gate/gate_factory.hpp>
#include <scaluq/operator/operator.hpp>
#include <scaluq/state/state_vector.hpp>
int main() {
scaluq::initialize(); // must be called before using any scaluq methods
{
constexpr Precision Prec = Precision::F64;
constexpr ExecutionSpace Space = ExecutionSpace::Default;
const std::uint64_t n_qubits = 3;
scaluq::StateVector<Prec, Default> state = scaluq::StateVector<Prec, Default>::Haar_random_state(n_qubits, 0);
std::cout << state << std::endl;
scaluq::Circuit<Prec, Default> circuit(n_qubits);
circuit.add_gate(scaluq::gate::X<Prec, Default>(0));
circuit.add_gate(scaluq::gate::CNot<Prec, Default>(0, 1));
circuit.add_gate(scaluq::gate::Y<Prec, Default>(1));
circuit.add_gate(scaluq::gate::RX<Prec, Default>(1, std::numbers::pi / 2));
circuit.update_quantum_state(state);
scaluq::Operator<Prec, Default> observable(n_qubits);
observable.add_random_operator(1, 0);
auto value = observable.get_expectation_value(state);
std::cout << value << std::endl;
}
scaluq::finalize(); // must be called last
}
from scaluq.default.f64 import *
import math
n_qubits = 3
state = StateVector.Haar_random_state(n_qubits, 0)
circuit = Circuit(n_qubits)
circuit.add_gate(gate.X(0))
circuit.add_gate(gate.CNot(0, 1))
circuit.add_gate(gate.Y(1))
circuit.add_gate(gate.RX(1, math.pi / 2))
circuit.update_quantum_state(state)
observable = Operator(n_qubits)
observable.add_random_operator(1, 0)
value = observable.get_expectation_value(state)
print(value)
scaluqでは、計算に使用する浮動小数点数のサイズとしてf16
f32
f64
bf16
が選択できます。ただしデフォルトのビルドオプションではf16
bf16
は無効になっています。
通常はf64
の使用が推奨されますが、量子機械学習での利用などあまり精度が必要でない場合はf32
以下を使用すると最大2~4倍の高速化が見込めます。
各精度の指定方法と内容は以下のとおりです。
精度 | C++で指定するテンプレート引数 | Pythonで指定するサブモジュールの名前 | 内容 |
---|---|---|---|
f16 |
Precision::F16 |
f16 |
IEEE754 binary16 |
f32 |
Precision::F32 |
f16 |
IEEE754 binary32 |
f64 |
Precision::F64 |
f16 |
IEEE754 binary64 |
bf16 |
Precision::BF16 |
bf16 |
bfloat16 |
また、実行スペースとして default
host
が選択できます。CPUビルドではこの2つの振る舞いは等しく、SCALUQ_USE_CUDA
を使用してCUDA環境でビルドした場合、default
はGPU上での実行、host
はCPU上での実行となります。
規模が大きくなるとGPU上での実行のほうが高速ですが、ホスト・デバイス間のメモリ転送にはオーバーヘッドがかかります。
各実行スペースの指定方法と内容は以下のとおりです。
実行スペース | C++で指定するテンプレート引数 | Pythonで指定するサブモジュールの名前 | 内容 |
---|---|---|---|
default |
ExecutionSpace::Default |
default |
CUDA環境の場合GPU、そうでない場合CPU |
host |
ExecutionSpace::Host |
host |
CPU |
同じ精度、実行スペースのオブジェクト同士でしか演算を行うことができません。
例えば32bit用に作成したゲートでは64bitのStateVector
を更新できず、同じ精度でもhost用に作成したゲートではdefault用に作成したStateVector
を更新できません。
C++の場合、状態、ゲート、演算子、回路のクラスやゲートを生成する関数が、テンプレート引数を取るようになっており、そこにPrecision
型の値とExecutionSpace
型の値を指定します。
Pythonの場合、精度と実行スペースに合わせてscaluq.default.f32
やscaluq.host.f64
のようなサブモジュールからオブジェクトをimport
します。
Pythonでは以下のようにimportlib
を用いることで文字列からダイナミックに選択できます。
import importlib
prec = 'f64'
space = 'default'
scaluq_sub = importlib.import_module(f'scaluq.{space}.{prec}')
StateVector = scaluq_sub.StateVector
gate = scaluq_sub.gate
state = StateVector(3)
x = gate.X(0)
x.update_quantum_state(state)
print(state)