Sunday, 14 December 2025

Data Science Competence Center

2017 Spring

24 May

Nagy Gyula (SZTE): Tudománymetriai és tartalmi elemzések szövegbányászati módszerekkel

Abstract: tudományos élet szereplői számára az olyan nemzetközi hivatkozási adatbázisok használata, mint a Web of Science vagy a Scopus egyre inkább ismertek és megkerülhetetlenek. Mindemellett azonban teljes tudományterületek léteznek hazánkban, amelyek ezen adatbázisokban csak kevéssé reprezentálódnak [Scival, Hungary 2011-2015: Social Sciences 4,4%; Arts and Humanities 2,7%; Other 7,7%]. A jelenség több okra vezethető vissza: egyrészt a "soft science" tudományágak publikálási szokásai jelentősen eltérnek a "hard science" diszciplínák publikálási gyakorlatától (ti. tanulmánykötet, monográfia, stb.), másrészt ezen területek hazai kutatói előszeretettel publikálnak olyan folyóiratokban, amelyeket a nemzetközi hivatkozási adatbázisok nem indexelnek. Azonban részükről ugyanolyan elemi igény mutatkozna saját tudományterületük belső szerkezetének felderítésére. Mindezt a kívánságot a tudományos együttműködés hálózatainak felderítése által és egy-egy folyóirat, vagy akár egy egész diszciplína hivatkozási gráfjának megalkotásával tudjuk teljesíteni. A fenti vizsgálódás elvégzéséhez - a bevett tudománymetriai elemzési módszerek mellett - egyaránt érdemes segítségül hívnunk a szövegbányászat és a hálózattudomány eszközeit. Az előadásban egy pilotprojekt tapasztalatai kerülnek bemutatásra, melynek keretében kísérletet tettünk két magyar nyelvű, társadalomtudományi folyóirat teljes tudománymetriai elemzésére. Kutatásunkban kiemelt figyelmet szenteltünk a társszerzőségi gráfok előállításának, illetve a folyóiratok teljes hivatkozási hálózatának megalkotására, mely a magas elemszám miatt csak a hivatkozások automatikus extrakciója által volt megvalósítható. A tudománymetriai elemzések mellett az egyik tárgyalt folyóirat esetében egy összetett tartalmi elemzésre is kísérletet tettünk a szövegbányászat megoldásain keresztül.


27 Apr

István Hegedűs (University of Szeged): Gossip-Based Machine Learning and Matrix Decomposition

Abstract: We are talking about distributed learning, when we wish to build models or compute aggregations on data sets that are stored on a large set of computers. Standard methods for processing distributed data first collect them in data centers and run centralized algorithms. But models can be built on the data sets without centralized algorithms as well. In my presentation, I will talk about the distributed data aggregation and modeling, introduce the basics of machine learning and classification. Finally, I will present a gossip-based solution of the distributed learning and an algorithm that can be used for low-rank matrix decomposition.


6 Apr

Péter Erdős (Rényi Institute): Degree Sequences' Realizations

Abstract: This talk can be considered as a prequel to István Miklós' talk on March 23, 2017, but it is completely self contained. It discusses realization and listing problems of different degree sequence type questions. These are fundamental tools for studying synthetic graphs which simulate real life networks.


23 Marc

István Miklós (Rényi Institute): Exact sampling of graphs with prescribed degree correlations

Abstract: Many real-world networks exhibit correlations between the node degrees. For instance, in social networks nodes tend to connect to nodes of similar degree. Conversely, in biological and technological networks, high-degree nodes tend to be linked with low-degree nodes. Degree correlations also affect the dynamics of processes supported by a network structure, such as the spread of opinions or epidemics. The proper modelling of these systems, i.e., without uncontrolled biases, requires the sampling of networks with a specified set of constraints. We present a solution to the sampling problem when the constraints imposed are the degree correlations. Furthermore we would like to give a brief survey of our current knowledge of generating such random networks.


9 Marc

Federico Musciotto(University of Palermo and CEU): Timely evolution and core of communities of statistically validated projections of bipartite networks

Abstract: Many complex systems are naturally organized in bipartite networks, i.e. networks with two disjoint sets of node, usually characterized by high heterogeneity. Although useful information can be extracted from these networks, their projections are not always stable and robust against errors in the data or other sources of noise. A solution to this issue is based on statistically validated networks, which reduce the original system by considering only the links which are statistically significant. In this way, cores of the real communities of the system are obtained with a high level of precision. Moreover, the methodology of SVN can be extended in order to track the evolution in time of the communities of a system. In this talk I will show the results of these methods on a dataset of stock market Finnish investors, characterized by high heterogeneity with respect to trading activity. This work is the result of a collaboration with Luca Marotta, Jyrki Piilo and Rosario N. Mantegna.