chess_inator/nnue/s3_train_neural_net.py

#!/usr/bin/env python

"""Train the NNUE weights."""

import torch
import pandas as pd
import numpy as np

from torch.utils.data import Dataset, DataLoader
from pathlib import Path
from dataclasses import dataclass


################################
################################
## Data loading / parsing
################################
################################


@dataclass
class Position:
    """Single board position."""

    fen: str
    """Normal board representation."""

    board: torch.Tensor
    """Multi-hot board representation."""

    cp_eval: np.double
    """Centipawn evaluation (white perspective)."""

    expected_points: np.double
    """
    Points expected to be gained for white from the game, based on centipawn evaluation.

    - 0: black win
    - 0.5: draw
    - 1: white win
    """


def sigmoid(x):
    """Calculate sigmoid of `x`, using scaling constant `K`."""
    K = 150
    return 1 / (1 + np.exp(-K * x / 400))


class ChessPositionDataset(Dataset):
    def __init__(self, data_file: Path):
        self.data = pd.read_csv(data_file, delimiter="\t")

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        row = self.data.iloc[idx]

        eval = np.double(row.iloc[2])

        return Position(
            fen=row.iloc[0],
            board=torch.as_tensor([1 if c == "1" else 0 for c in row.iloc[1]]),
            cp_eval=eval,
            expected_points=sigmoid(eval/100),
        )

if __name__ == "__main__":
    full_dataset = ChessPositionDataset(Path("combined_training.tsv.gz"))

    train_dataset, test_dataset = torch.utils.data.random_split(full_dataset, [0.8, 0.2])

    train_dataloader = DataLoader(train_dataset, batch_size=64, shuffle=True)
    test_dataloader = DataLoader(test_dataset, batch_size=64, shuffle=True)
feat: torch data loader 2024-12-30 22:53:59 -05:00			`#!/usr/bin/env python`

			`"""Train the NNUE weights."""`

			`import torch`
			`import pandas as pd`
			`import numpy as np`

			`from torch.utils.data import Dataset, DataLoader`
			`from pathlib import Path`
			`from dataclasses import dataclass`


			`################################`
			`################################`
			`## Data loading / parsing`
			`################################`
			`################################`


			`@dataclass`
			`class Position:`
			`"""Single board position."""`

			`fen: str`
			`"""Normal board representation."""`

			`board: torch.Tensor`
			`"""Multi-hot board representation."""`

			`cp_eval: np.double`
			`"""Centipawn evaluation (white perspective)."""`

			`expected_points: np.double`
			`"""`
			`Points expected to be gained for white from the game, based on centipawn evaluation.`

			`- 0: black win`
			`- 0.5: draw`
			`- 1: white win`
			`"""`


			`def sigmoid(x):`
			"""Calculate sigmoid of `x`, using scaling constant `K`."""
			`K = 150`
			`return 1 / (1 + np.exp(-K * x / 400))`


			`class ChessPositionDataset(Dataset):`
			`def __init__(self, data_file: Path):`
			`self.data = pd.read_csv(data_file, delimiter="\t")`

			`def __len__(self):`
			`return len(self.data)`

			`def __getitem__(self, idx):`
			`row = self.data.iloc[idx]`

			`eval = np.double(row.iloc[2])`

			`return Position(`
			`fen=row.iloc[0],`
			`board=torch.as_tensor([1 if c == "1" else 0 for c in row.iloc[1]]),`
			`cp_eval=eval,`
			`expected_points=sigmoid(eval/100),`
			`)`

			`if __name__ == "__main__":`
			`full_dataset = ChessPositionDataset(Path("combined_training.tsv.gz"))`

			`train_dataset, test_dataset = torch.utils.data.random_split(full_dataset, [0.8, 0.2])`

			`train_dataloader = DataLoader(train_dataset, batch_size=64, shuffle=True)`
			`test_dataloader = DataLoader(test_dataset, batch_size=64, shuffle=True)`