Livrable 1 - data
1. Contexte scientifique
Le projet snoboard s'inscrit dans l'ANR metribo. Il a pour but de proposer un catalogue de modifications guidés par des petits ARN non codants (guide). Ce catalogue sera accessible par une interface web, mais aussi de façon programmatique (api, requêtes directes sur la base de données/connaissance)
Les données proposées seront curées et annotées par des information de
- provenance,
- confiance/correction (+/- vrai faux)
- qualité (prédit/confirmé/évidence)
- conservation inter espèce
- les gènes associés (zone introniques)
2. Description de la demande
Nous allons alimenter la base de données/connaissances neo4j du livrable 1.
Les organismes suivants seront ciblés:
- plante (A. Thaliana)
- humaine (H. Sapiens)
- levure (S. cerevisiae)
Nous incorporerons les données suivantes, qui concernent les guides, cibles et modification, ainsi que leurs interactions:
Organisme | Source | 2'-O-méthylations | pseudouridylation | C/D box | H/ACA box | scaRNA | Duplexes |
---|---|---|---|---|---|---|---|
H. sapien | snoRNA-db (LBME) | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
S. cerevisiae | fournierlab | ✓ | ✓* | ✓ | ✓ | ✓ | |
A. thaliana | partenaires | ✓ | ☐ | ✓ | ☐ | _** |
- ✓ données déjà inclues
- ☐ données à inclure
- Manque la cible U2
- _** réalisé pour C/D box uniquement
Ces données ne sont que partiellement vérifiées.
Pour l'instant, les données diffusées sont publiques, mais nous devons définir la licence sous laquelle seront diffusée les données une fois curées.
3. Organisation
3.1 Planning
Cette version doit être réalisée pour décembre 2024.
3.2 Personnes
Données brute: Christine Gaspin Traitement: Philippe Bordron.
Tests du traitement: Julien Touchais, Philippe Bordron, Christine Gaspin.
3.3 Ressources matérielles
Une VM fournie par la pf genotoul-bioinfo pour le déploiement dev, pre-prod et prod.
3.4 Ressources financières
Le projet snoboard est financé par le projet d'ANR Metribo
4. Échéancier
- décembre 2024
5. Critères de validations
Les données seront vérifiées par PB et CG à la fois en utilisant des outils de vérification de la consistence lors de l'ajout, et en vérifiant à la main les données au travers du site web.
6. Suivi du projet
Les CR des réunions du projets sont disponibles là : https://nextcloud.inrae.fr/f/104651389
7. Revue de projet et modifications du planning et des ressources
7.1 Revue de projet 2024-10-04
Ce livrable a été créé afin de découpler le site web/api/base de donnée et le contenu de la base.
7.2 Revue de projet 2025-02-14
Ce qui a été fait
- Nettoyage des données
Décision
Les tests sur les données sont OK
Les données HACA et Pseudouridilation sur A. thaliana ne seront finalement pas inclues dans ce livrable. Elles seront inclues dans le livrable 2. La publication de ces données sera sous embargo jusqu'à la publication de l'article.
Ainsi ce livrable peut-être clos.
Pas de modification de ressources pour ce livrable.