state

Main application state variables

`State = StateData()` `module-attribute` #

Specific StateData instance used for app

`StateData` #

Holds app-wide state variables

Attributes:

Name	Type	Description
`mapping`	`Reactive[DataFrame]`	bitmappings dataframe, used for targeting filters.
`datamodel`	`Reactive[DataFrame]`	column glossary dataframe
`df`	`Reactive[DataFrame]`	loaded dataframe file, defaults to nothing but app will instantiate with one loaded.
`columns`	`Reactive[dict[str, list[str]]]`	column lookup, used for guardrailing.
`release`	`str`	release type
`datatype`	`str`	datatype of file

Source code in src/sdss_explorer/dashboard/dataclass/state.py

class StateData:
    """Holds app-wide state variables

    Attributes:
        mapping (solara.Reactive[vx.DataFrame]): bitmappings dataframe, used for targeting filters.
        datamodel (solara.Reactive[pd.DataFrame]): column glossary dataframe

        df (solara.Reactive[vx.DataFrame]): loaded dataframe file, defaults to nothing but app will instantiate with one loaded.
        columns (solara.Reactive[dict[str,list[str]]]): column lookup, used for guardrailing.

        release (str): release type
        datatype (str): datatype of file
    """

    def __init__(self):
        # app settings, underscored to hide prop
        self._release = sl.reactive(cast(str, None))  # TODO: dr19
        self._datatype = sl.reactive(cast(str, None))

        # globally shared, read only files
        self.mapping = sl.reactive(
            open_file("mappings.parquet"))  # mappings for bitmasks
        self.datamodel = sl.reactive(load_datamodel(
            self.release))  # datamodel spec

        # adaptively rerendered on changes; set on startup in app root
        self.df = sl.reactive(cast(vx.DataFrame, None))  # main datafile
        self.columns = sl.reactive(cast(
            dict, None))  # column glossary for guardrailing

        # user-binded instances
        # NOTE: this approach allows UUID + subsetstore to be read-only
        self._uuid = sl.reactive(sl.get_session_id())
        self._kernel_id = sl.reactive(sl.get_kernel_id())
        self._subset_store = sl.reactive(SubsetStore())

    def load_dataset(self,
                     release: Optional[str] = None,
                     datatype: Optional[str] = None) -> bool:
        """load the HDF5 dataset for the dashboard"""
        # use attributes if not manually overridden
        if not release:
            release = self.release
        if not datatype:
            datatype = self.datatype

        # start with standard open operation
        # TODO: redux version via envvar?
        df = open_file(
            f"{release}/explorerAll{datatype.capitalize()}-{VASTRA}.hdf5")
        columns = load_column_json(release, datatype)

        if (df is None) and (columns is None):
            logger.critical(
                "Part of dataset load failed! ensure everything is setup (files, envvars)"
            )
            return False

        # set reactives
        self.df.set(df)
        self.columns.set(columns)

        return True

    @property
    def release(self) -> str:
        """Current release of app (dr19, etc)"""
        return str(self._release.value)

    @property
    def datatype(self) -> str:
        """Current datatype of app (star or visit)"""
        return str(self._datatype.value)

    def get_default_dataset(self) -> str:
        """Method version to get the default dataset of app (star or visit). Used for defaulting the Subset dataclass"""
        datatype = self._datatype.value
        return "mwmlite" if datatype == "star" else "thepayne"

    def get_df(self) -> vx.DataFrame:
        """Method version to get the dataframe. Used for defaulting the Subset dataclass"""
        df = self.df.value
        return df

    @property
    def uuid(self) -> str:
        """User ID; Solara Session ID"""
        return str(self._uuid.value)

    @property
    def kernel_id(self) -> str:
        """Virtual kernel ID"""
        return str(self._kernel_id.value)

    @property
    def subset_store(self):
        """Internal subset backend"""
        return self._subset_store.value

    def __repr__(self) -> str:
        """Show relevant properties of class as string."""
        return "\n".join(
            f"{k:15}: {v}" for k, v in {
                "uuid": self.uuid,
                "kernel_id": self.kernel_id,
                "df": hex(id(self.df.value)),  # dataframe mem address
                "subset_backend": hex(id(self.subset_store)),
                "release": self.release,
                "datatype": self.datatype,
            }.items())

`datatype` `property` #

Current datatype of app (star or visit)

`kernel_id` `property` #

Virtual kernel ID

`release` `property` #

Current release of app (dr19, etc)

`subset_store` `property` #

Internal subset backend

`uuid` `property` #

User ID; Solara Session ID

`repr()` #

Show relevant properties of class as string.

Source code in src/sdss_explorer/dashboard/dataclass/state.py

def __repr__(self) -> str:
    """Show relevant properties of class as string."""
    return "\n".join(
        f"{k:15}: {v}" for k, v in {
            "uuid": self.uuid,
            "kernel_id": self.kernel_id,
            "df": hex(id(self.df.value)),  # dataframe mem address
            "subset_backend": hex(id(self.subset_store)),
            "release": self.release,
            "datatype": self.datatype,
        }.items())

`get_default_dataset()` #

Method version to get the default dataset of app (star or visit). Used for defaulting the Subset dataclass

Source code in src/sdss_explorer/dashboard/dataclass/state.py

def get_default_dataset(self) -> str:
    """Method version to get the default dataset of app (star or visit). Used for defaulting the Subset dataclass"""
    datatype = self._datatype.value
    return "mwmlite" if datatype == "star" else "thepayne"

`get_df()` #

Method version to get the dataframe. Used for defaulting the Subset dataclass

Source code in src/sdss_explorer/dashboard/dataclass/state.py

def get_df(self) -> vx.DataFrame:
    """Method version to get the dataframe. Used for defaulting the Subset dataclass"""
    df = self.df.value
    return df

`load_dataset(release=None, datatype=None)` #

load the HDF5 dataset for the dashboard

Source code in src/sdss_explorer/dashboard/dataclass/state.py

def load_dataset(self,
                 release: Optional[str] = None,
                 datatype: Optional[str] = None) -> bool:
    """load the HDF5 dataset for the dashboard"""
    # use attributes if not manually overridden
    if not release:
        release = self.release
    if not datatype:
        datatype = self.datatype

    # start with standard open operation
    # TODO: redux version via envvar?
    df = open_file(
        f"{release}/explorerAll{datatype.capitalize()}-{VASTRA}.hdf5")
    columns = load_column_json(release, datatype)

    if (df is None) and (columns is None):
        logger.critical(
            "Part of dataset load failed! ensure everything is setup (files, envvars)"
        )
        return False

    # set reactives
    self.df.set(df)
    self.columns.set(columns)

    return True

`load_column_json(release, datatype)` #

Load the pre-compiled column JSON for a given dataset.

Parameters:

Name	Type	Description	Default
`release`	`str`	data release directory to for	required
`datatype`	`str`	specific datatype of file to load. (`'star', 'visit'`)	required

Source code in src/sdss_explorer/dashboard/dataclass/state.py

def load_column_json(release: str, datatype: str) -> dict | None:
    """Load the pre-compiled column JSON for a given dataset.

    Args:
        release: data release directory to for
        datatype: specific datatype of file to load. (`'star', 'visit'`)

    """
    # get dataset name
    datapath = settings.datapath

    # fail case for no envvar
    if datapath is None:
        return None

    file = f"{release}/columnsAll{datatype.capitalize()}-{VASTRA}.json"
    path = pathlib.Path(f"{datapath}/{file}")
    if not path.exists():
        logger.critical(
            "Expected to find %s for column lookup, didn't find it.", file)
        return None

    with open(path, "r", encoding="utf-8") as f:
        data = json.load(f)
        return data

`load_datamodel(release=None)` #

Loads a given compiled datamodel, used in conjunction with the column glossary

Source code in src/sdss_explorer/dashboard/dataclass/state.py

def load_datamodel(release: str = None) -> pd.DataFrame | None:
    """Loads a given compiled datamodel, used in conjunction with the column glossary"""
    datapath = settings.datapath
    # no datapath
    if datapath is None:
        return None

    # no fail found
    # TODO: replace with a real datamodel from the real things
    # TODO: this is globally set on app start; these needs to be set dynamically by the app
    # file = "ipl3_partial.json"
    release = None if release == "None" else release
    release = release or "dr19"
    file = f"{release.lower()}_dminfo.json"

    path = pathlib.Path(f"{settings.datapath}/{file}")
    if not path.exists():
        logger.critical(
            "Expected to find %s for column glossary datamodel, didn't find it.",
            path)
        return None

    try:
        with open(f"{settings.datapath}/{file}", "r", encoding="utf-8") as f:
            data = json.load(f).values()
    except Exception as e:
        logger.debug("caught exception on datamodel loader: %s", e)
        return None
    else:
        logger.info("successfully loaded datamodel")
        return pd.DataFrame(data)  # TODO: back to vaex

`open_file(filename)` #

Vaex open wrapper for datafiles to ensure authorization/file finding.

Parameters:

Name	Type	Description	Default
`filename`	`str`	filename to open	required

Source code in src/sdss_explorer/dashboard/dataclass/state.py

def open_file(filename):
    """Vaex open wrapper for datafiles to ensure authorization/file finding.

    Args:
        filename (str): filename to open

    """
    # get dataset name
    datapath = settings.datapath

    # fail case for no envvar
    if datapath is None:
        return None

    # TODO: verify auth status when attempting to load a working group dataset
    try:
        dataset = vx.open(f"{datapath}/{filename}")
        dataset = dataset.shuffle(
            random_state=42
        )  # shuffle to ensure skyplot looks nice, constant seed for reproducibility
        return dataset
    except FileNotFoundError:
        logger.critical("Expected to find %s for dataframe, didn't find it.",
                        filename)
        return None
    except Exception as e:
        logger.debug("caught exception on dataframe load: %s", e)
        return None

state

State = StateData() module-attribute #

StateData #

datatype property #

kernel_id property #

release property #

subset_store property #

uuid property #

__repr__() #

get_default_dataset() #

get_df() #

load_dataset(release=None, datatype=None) #

load_column_json(release, datatype) #

load_datamodel(release=None) #

open_file(filename) #

`State = StateData()` `module-attribute` #

`StateData` #

`datatype` `property` #

`kernel_id` `property` #

`release` `property` #

`subset_store` `property` #

`uuid` `property` #

`repr()` #

`get_default_dataset()` #

`get_df()` #

`load_dataset(release=None, datatype=None)` #

`load_column_json(release, datatype)` #

`load_datamodel(release=None)` #

`open_file(filename)` #