Prévoir les pumps de Bitcoin avec Google Big Query #Sfiles

Trading du CoinTrading du Coin
4.5
(31)

Encore un titre sordide, un nouvel illuminé qui me vend la recette pour réussir tous mes trades” – Il est probable que certains d’entre vous se disent ça avec un titre pareil. Néanmoins messieurs j’ai jugé l’observation réalisée à travers cette expérience très intéressante et la méthode d’analyse employée pertinente, nous allons en effet étudier les données de Reddit, afin de voir si celles-ci nous donnent des indices sur les évolutions du prix de Bitcoin. Aujourd’hui je vous propose une reprise visuelle et complète des travaux de mes collègues de chez ChartStar. Je vous recommande de vous inscrire sur leur plateforme, car pour célébrer l’arrivée très prochaine de leurs services, la première année d’abonnement est offerte aux premiers venus.

La Quête de la sainte requête : Google BigQuery

Allons droit au but, le concept ici est d’analyser d’énormes ensembles de données en extraire des informations spécifiques, les visualiser dans un format adéquat afin d’émettre des thèses qualitatives sur l’évolution d’un actif.

GoogleBigQuery est un outil puissant pouvant traiter des volumes de données gigantesques très rapidement. Il peut être employé à des fins d’analyses et c’est ce que nous allons faire ici. L’objectif est d’interroger la base de données de Reddit sur le nombre de mentions du mot “bitcoin” dans les commentaires de 2016 à 2020.

Utiliser BigQuery gratuitement

Faire travailler les data-centers de BigQuery pour satisfaire nos besoins d’information a un prix. Fort heureusement, ils offrent 300$ de crédit d’essai pour Google Cloud, ce qui est largement suffisant pour formuler un bon nombre de requêtes dans le style de celle que je vais vous présenter. Afin de bénéficier de ce cadeau, ils vous demandent de renseigner des coordonnées bancaires dans l’onglet de facturation. Un minimum d’engagement pour la crédibilité, hehe. Rassurez-vous si vous dépassez votre crédit d’essai, vos projets seront interrompus afin de vérifier que vous êtes consciemment en train d’explorer les méandres de la sur-facturation.

Petit tip : Vous pouvez utiliser les fameuses cartes VISA jetables de Revolut pour créer votre compte ( ou même plusieurs 😎 )

La Requête

Une fois votre compte créé vous atterrissez sur un dashboard, rendez-vous directement sur la console BigQuery et collez la requête SQL suivante :

SELECT STRFTIME_UTC_USEC(created_utc*1000000, '%Y-%m') month, SUM(LOWER(body) CONTAINS 'bitcoin') count
FROM TABLE_QUERY([fh-bigquery:reddit_comments], "LEFT(table_id, 4) BETWEEN '2016' and '2020'")
GROUP BY 1
HAVING month BETWEEN '2016' AND '2020'
ORDER BY 1 

Jetons-y un oeil, on peut voir que les bornes de recherches dans le temps sont définies sur l’ensemble “BETWEEN ‘2016’ et ‘2020’ ” . La table de données sondée et celles des commentaires Reddit ‘[fh-bigquery:reddit_comments]’ et le mot cible est “bitcoin” qu’il soit en majuscules ou minuscules ‘LOWER(body)” ‘ .

Libre à vous de modifier les paramètres de cette requête type pour étudier d’autres phénomènes/cryptos sur d’autres bases de données supportées par Google

L’exécution

Avant d’exécuter la requête, il vous faut impérativement changer le dialecte SQL de votre console de Standard vers “Ancien”, sinon une erreur de syntaxe vous empêchera d’aller plus loin. Comme vous pouvez le voir, interroger l’ensemble des commentaires de 2016 à 2020 revient à traiter près de 700GB de fichiers, cela prendrait une éternité avec une machine domestique d’où l’intérêt du Cloud Computing ici.

Cliquez sur exécuter et attendez une trentaine de secondes pour obtenir vos résultats dans une jolie table que vous allez pouvoir exploiter sur un classeur Excel. Sur ce classeur vous avez les mois sur la colonne de gauche et le nombre de mentions sur la colonne de droite.

Ah j’allais oublier ! Cette commande vous coûtera environ 0,70€ sur vos 277€ de crédit d’essai. 😉

L’analyse

Essayons de confronter le nombre de mentions avec le prix de bitcoin à la fin de chacun de ces mois. Pour se faire j’ai relevé le prix de bitcoin sur 48 mois en me basant sur la table historique de CoinMarketCap, si vous avez besoin du prix n’hésitez pas à vous servir sur ce classeur.

Tada !

Curieusement le nombre de mentions du mot “bitcoin” semble avoir augmenté avant le prix lors du pump de 2017. Pour la suite c’est moins convaincant, mais il y’a des chances qu’une hausse d’activité sur Reddit à l’image de celle de fin 2017 peut présager d’un pump sur Bitcoin. Une simple d’histoire d’intensité. J’attends vos avis sur cette hypothèse.

Il est possible de réaliser cette expérience sur d’autres devises et sur d’autres échelles de temps. J’ai remarqué un comportement semblable entre les mentions du mot “ethereum” et le prix de l’actif.

Conclusion

Je suis convaincu par l’analyse de sentiments et son potentiel pour prédire des variations de prix. L’étude de grands volumes de données a toujours été pour moi quelque chose d’inaccessible au “coiniste” lambda, mais il s’avère que certaines solutions combinées à des maquettes d’usage simples peuvent déjà nous offrir des résultats sympathiques. J’attends maintenant des consignes supplémentaires de le part pushshift.io afin d’explorer les possibilités offertes par le traitement des données d’activité de Reddit en temps réel. En cas de grandes découvertes, je ne manquerai de partager avec vous !

Bon dimanche !

Vous avez apprécié cet article ?

Cliquez pour lui donner votre note !

Moyenne 4.5 / 5. Nombre de votes : 31

Pas encore de votes ! Soyez le premier à noter cet article.

Sami
Fervent passionné de devises numériques, et même des plus louches! Je passe mon temps sur le net à analyser des projets fragiles et à brasser un maximum d'actualités sous plusieurs langues . Il m'arrive parfois d'écrire, faisant de mon mieux pour publier le moins d'inepties possible, bien entendu. A bientôt dans la crypto ! contact : [email protected]

2
Poster un Commentaire

avatar
1 Fils de commentaires
1 Réponses de fil
0 Abonnés
 
Commentaire avec le plus de réactions
Le plus populaire des commentaires
plus récent plus ancien Le plus populaire
Katak
Invité
Katak

Le résultat s’arrête en septembre 2019…. si on a pas un résultat le jour même, quel est l’avantage ?