scirpy.datasets.wu2020_3k¶

scirpy.datasets.wu2020_3k()¶

Return the dataset from [WMdA+20] as AnnData object, downsampled to 3000 TCR-containing cells.

This is how the dataset was processed:

import scanpy as sc

adata = sc.read_h5ad("wu2020.h5ad")
adata = adata[adata.obs["has_tcr"] == "True", :]
sc.pp.subsample(adata, n_obs=3000)
adata.write_h5ad("wu2020_3k.h5ad")

Return type: AnnDataAnnData