move first semester to first semester

This commit is contained in:
Motiejus Jakštys
2020-04-08 22:49:30 +03:00
parent db18a17f66
commit b97b04e9bb
93 changed files with 0 additions and 0 deletions

Binary file not shown.

View File

@@ -0,0 +1,50 @@
Kol kas dedu resursus, kurie gali būti įdomūs atsakyti į klausimą.
Ieškojau šiuose puslapiuose:
- google scholar
- VU bibliotekos elektroniniuose ištekliuose
Nurodydamas pagrindinius raktinius žodžius įvairiomis kombinacijomis, įskaitant:
- decreasing detail
- increasing mistakes
- evaluate perception
- cartography/maps
Rasti resursai apžvelgti žemiau.
How to lie with maps, 3rd edition
---------------------------------
Autorius: Mark Monmonier
Pirmi keliasdešimt puslapių vieši[1].
Kaip nurodo pavadinimas, knyga nurodo pagrindinius žemėlapių "melus". Tačiau
nemini apie suvokimo klaidas ar jų skaičiavimą, neminimi tyrimai.
Lying with Maps
---------------
Knygos "How to lie with maps" santrumpa. Autorius: Mark Monmonier
Pilnas tekstas pasiekiamas per VU biblioteką[2].
Tai veda į galbūt įdomų straipsnį:
JENKS,G.F.andCASPALL, F. C. (1971). Error on choroplethicmaps: Definition,
measurement, reduction.Annals of the Asso-ciation of American
Geographers61217244.[3]
Žiūrime, kas cituojame, ir randame kelis:
- Assessing the effect of attribute uncertainty on the robustness of choropleth map classification
Ningchuan Xiao , Catherine A. Calder & Marc P. Armstrong [4]
Tačiau straipsnio pamatyti sistema neleidžia.
Pabaigai
--------
Radau straipsnių, rašančių panašia tema, tačiau ne tiksliai to, ko ieškau.
[1] https://books.google.lt/books?id=MwdRDwAAQBAJ&lpg=PP8&ots=NtuUI4GdZa&dq=visual%20perception%20mistakes%20in%20maps&lr&hl=lt&pg=PA8#v=onepage&q&f=false
[2]: https://projecteuclid.org/download/pdfview_1/euclid.ss/1124891287
[3]: https://www.tandfonline.com/doi/abs/10.1111/j.1467-8306.1971.tb00779.x
[4]: https://www.tandfonline.com/doi/abs/10.1080/13658810600894307

View File

@@ -0,0 +1,8 @@
ifdef IN_DOCKER
toolshed = docker run --rm -v $(PWD):/x -w /x motiejus/toolshed
endif
all: report1.pdf report2.pdf
report%.pdf: report%.tex
$(toolshed) latexmk -pdf $<

View File

@@ -0,0 +1,16 @@
- Pasirinkti kelias dominančias problemines sritis.
- Pakomentuoti tarptautinių organizacijų veiklą.
- Plačiau susipažinti su viešai skelbiama informacija apie tų sričių problemas
ir pasiekimus.
1. TYRIMO PROBLEMA Konkrečiai suformuluota mokslinio tyrimo reikalaujanti ir
neišspręsta problema. Pagrindimas, kad jai spręsti reikia mokslinių tyrimų.
Bendras situacijos įvertinimas, paremtas literatūros apžvalga.
2. TYRIMO TIKSLAS Kokio teigiamo pokyčio galėtumėt pasiekti savo tyrimu.
Įvardykite norimą pokyti ir jo objektyvų rodiklį (rodiklius)
3. TYRIMO KLAUSIMAS Klausimas, į kurį tikitės atsakyti, atlikę tyrimą. [[
Operacionalizuokite sąvokas - tiksliai jas apibrėžkite, nurodykite kaip bus
matuojami parametrai. ]]
4. TYRIMO TEMA Temos pasiūlymas, kurį pateiksite pasirinktam vadovui.

View File

@@ -0,0 +1,42 @@
\documentclass{article}
\usepackage[L7x,T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[lithuanian]{babel}
\usepackage{hyperref}
\title{Mokslinių tyrimų metodologija\\ \vspace{4mm}
Antroji užduotis -- magistro darbų problemos}
\author{Motiejus Jakštys}
\date{\today}
\begin{document}
\maketitle
\section{TYRIMO PROBLEMA}
Sujungti kelias paviršiaus nuotraukas yra sudėtinga, kai paviršius yra
monotoniškas. Įprastinės priemonės reikalauja padėti aiškiai matomus daiktus
vietoj orientyrų, tačiau logistiškai tai yra sudėtinga. Šiame darbe
įvertinsime, ar kaip orientyrus naudojant nedidelius, mažos kainos bepiločius
orlaivius šį procesą galima paefektyvinti.
\section{TYRIMO TIKSLAS}
Siekiame padidinti tikslumą fotografuojant monotoniškus paviršius kiek įmanoma
mažai padidinant kainą. Tyrimo tikslas -- ištirti ir aprašyti kainos santykį
lyginant su egzistuojančiams metodais.
\section{TYRIMO KLAUSIMAS}
Ar naudojant mažus bepiločius orlaivius kaip orientyrus galima pagerinti
monotoniško paviršiaus ortofoto kokybę?
\section{TYRIMO TEMA}
Kiek pagerinamas monotoniško paviršiaus fotografavimo tikslumas naudojant mažus
bepiločius orlaivius kaip orientyrus?
\end{document}

View File

@@ -0,0 +1,31 @@
\documentclass{article}
\usepackage[L7x,T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[lithuanian]{babel}
\usepackage{hyperref}
\title{Mokslinių tyrimų metodologija\\ \vspace{4mm}
Antroji užduotis -- magistro darbų problemos}
\author{Motiejus Jakštys}
\date{\today}
\begin{document}
\maketitle
\section{TYRIMO PROBLEMA}
Kuri orų prognozės sistema yra tiksliausia Lietuvoje?
\section{TYRIMO TIKSLAS}
Naudojant istorinius duomenis įvertinti, kuri orų prognozavimo sistema yra
patikimiausia.
\section{TYRIMO KLAUSIMAS}
\section{TYRIMO TEMA}
\end{document}

View File

@@ -0,0 +1,4 @@
toolshed = docker run --rm -v $(PWD):/x -w /x motiejus/toolshed
task3-EpisodeAnalysis.pdf: task3-EpisodeAnalysis.tex bib.bib
$(toolshed) latexmk -pdf $<

View File

@@ -0,0 +1,17 @@
@book{szeliski2010computer,
title={Computer Vision: Algorithms and Applications},
author={Szeliski, R.},
isbn={9781848829350},
lccn={2010936817},
series={Texts in Computer Science},
url={https://books.google.de/books?id=bXzAlkODwa8C},
year={2010},
publisher={Springer London}
}
@mastersthesis{papert1966summer,
title={The Summer Vision Project},
author={Papert, S.},
school={MIT Artificial Intelligence Lab},
year=1966,
}

View File

@@ -0,0 +1,58 @@
\documentclass{article}
\usepackage[L7x,T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage[lithuanian]{babel}
\usepackage{hyperref}
\usepackage{cite}
\title{Mokslinių tyrimų metodologija\\ \vspace{4mm}
Trečioji užduotis -- Mokslo istorijos epizodo analizė}
\author{Motiejus Jakštys}
\date{\today}
\begin{document}
\maketitle
Susipažinti su pasirinktu mokslo istorijos epizodu (konkrečių tyrimų, atradimo
ar teorijos istorija), pageidautina, apimančiu inovatyvius ar prieštaringus
aiškinimus ar interpretacijas. Pakomentuoti, kuo atvejis įdomus.
Rezultatas trumpas tekstas (tezės). Turi būti paminėta epizodo esmė,
pagrindiniai faktai, kuo epizodas svarbus mokslo raidai arba (ir) kokius
svarbius mokslo metodologijos aspektus jis iliustruoja. Pateikti sistemoje.
\section{Įžanga - Labai Trumpa kompiuterių istorija}
Pirmasis bendrinio panaudojimo ({\it general purpose}) kompiuteris ENIAC buvo
sukurtas 1945 metais, ir kainavo apie \$7M dabartiniais pinigais.
Po 20 metų, septintojo dešimtmečio viduryje, kompiuteriai jau buvo labiau
pigesni, galingesni ir labiau prieinami, nei pirmasis, ir gana papiltę JAV
universitetuose.
\section{Vasaros Projektas}
Kartu su kompiuterių tobulėjimu, tuo metu populiarėjo "dirbtinio intelekto"
tyrimai. Viena įdomesnių problemų -- objektų nuotraukoje klasifikavimas. Vienas
iš MIT dirbtinio intelekto laboratorijos studentų pasiūlė per vasaros
"praktikos" darbą sukurti sistemą, kuri galėtų automatiškai atpažinti žinomus
objektus\cite{papert1966summer}.
\section{Rezultatai}
Projekto rezultatų aprašo rasti nepavyko, tačiau aišku, kad po 50-ies metų ši
sritis yra aktyviai pletojama ir vaizdų klasifikacijos problema iki galo nėra
išspręsta.
Anot \cite{szeliski2010computer}, šis vasaros projektas nepavyko. Tačiau
dešimtmečio viduryje-pabaigoje atsirado daug 3D vaizdo suvokimo tyrimų: kampų,
kraštų, trimačių objektų, kurie vėliau davė pagrindą semantiniam -- objektų --
suvokimui.
\bibliography{bib}{}
\bibliographystyle{plain}
\end{document}

2
I/MTM/task4-straipsnis/.gitignore vendored Normal file
View File

@@ -0,0 +1,2 @@
/db/
/README.html

View File

@@ -0,0 +1,8 @@
toolshed = docker run --rm -v $(PWD):/x -w /x motiejus/toolshed
all: README.html
README.html: README.md
$(toolshed) pandoc \
-T "$(shell head -1 $<)" \
--self-contained $< -o $@

View File

@@ -0,0 +1,274 @@
Pasaulio oro uostų įdomybės
===========================
Kai mokėmės duomenų bazių, paprastai pavyzdiniai duomenų bazių modeliai būdavo
gana panašūs vienas į kitą ir nuobodūs: sumodeliuoti biblioteką, sumodeliuoti
"draugų" duomenų bazę, ar gyvūnų klasifikaciją.
Šis įrašas parodys, kaip prie nuobodžių SQL tipų greitai galima pridėti
erdvinius, ir iš karto kokius įdomius klausimus galime uždavinėti. Apie oro
uostus. :)
Duomenų bazės sukūrimas
-----------------------
Susikurkime PostgreSQL lentelę su viso pasaulio oro uostais (bent tais, kurie
turi [IATA kodą][1]). Oro uostų informaciją gausime iš [openflights.org][3].
```
$ ./managedb init
```
Visi skriptai ir `airports.dat` (oro uostų informacija) yra [šioje
repositorijoje][2]; skriptai nedideli. Kad suprastumėte toliau esančias SQL
užklausas, rekomenduoju perskaityti `init.sql`.
Kai duombazė sukurta ir duomenys importuoti, patikrinkime, kas viduje:
```
psql airportgames <<<"
SELECT
iata,
name,
to_char(st_y (geom), '999.99') AS latitude,
to_char(st_x (geom), '999.99') AS longitude,
to_char(st_z (geom), '9999') AS altitude
FROM
airports
WHERE
iata IN ('VNO', 'RIX', 'TLL');
"
iata | name | latitude | longitude | altitude
------+-------------------------------+----------+-----------+----------
TLL | Lennart Meri Tallinn Airport | 59.41 | 24.83 | 40
RIX | Riga International Airport | 56.92 | 23.97 | 11
VNO | Vilnius International Airport | 54.63 | 25.29 | 198
```
Matome Vilniaus, Rygos ir Talino oro uostų informaciją: IATA kodą, pavadinimą,
ilgumą, platumą, aukštį virš jūros lygio metrais.
Dabar, kai informacija ranka pasiekiama, užduokime kelis įdomesnius klausimus,
ir juos atsakykime.
Užklausos
---------
**Kokie oro uostai yra labiausiai nutolę vienas nuo kito?**
```
SELECT
a.country AS a_country,
a.iata AS a_iata,
b.country AS b_country,
b.iata AS b_iata,
to_char(st_distance (a.geom, b.geom, TRUE) / 1000, '99999.99') AS distance_km
FROM
airports a,
airports b
WHERE
a.iata != '\N'
AND b.iata != '\N'
AND a.gid > b.gid
ORDER BY
distance_km DESC
LIMIT 10;
a_country | a_iata | b_country | b_iata | distance_km
------------------+--------+-------------------------+--------+-------------
China | ZQZ | Argentina | OES | 20002.42
Saudi Arabia | KMX | French Polynesia | PUK | 20000.78
Indonesia | TKG | Colombia | MQU | 20000.53
French Polynesia | NAU | Ethiopia | AXU | 20000.47
Nicaragua | RNI | Cocos (Keeling) Islands | CCK | 20000.20
China | JGS | Argentina | TUC | 19999.93
Malaysia | LGL | Brazil | TFF | 19998.43
New Zealand | HLZ | Spain | ODB | 19998.36
Indonesia | PLM | Colombia | NVA | 19998.19
Malaysia | KBR | Peru | CHH | 19998.13
```
Turint galvoje, kad pusė atstumo aplink žemę ties ekvatoriais yra 20037.50 km
(ties poliais - 20004 km!), atstumas tarp tolimiausių oro uostų yra gana arti
teorinio maksimumo: trūksta tik 35km iki teorinio maksimumo ties ekvatoriumi,
ir tik 2km iki teorinio maksimumo ties poliais.
**Kurie oro uostai yra arčiausiai vienas kito?**
```
SELECT
a.country AS a_country,
a.iata AS a_iata,
b.country AS b_country,
b.iata AS b_iata,
to_char(st_y (a.geom), 'FMSG999.0000') || ',' || to_char(st_x (a.geom), 'FMSG999.0000') AS a_latlng,
to_char(st_y (b.geom), 'FMSG999.0000') || ',' || to_char(st_x (b.geom), 'FMSG999.0000') AS b_latlng,
to_char(st_distance (a.geom, b.geom, TRUE) / 1000, '99999.99') AS distance_km
FROM
airports a,
airports b
WHERE
a.iata != '\N'
AND b.iata != '\N'
AND a.gid > b.gid
ORDER BY
a.geom <-> b.geom ASC
LIMIT 10;
a_country | a_iata | b_country | b_iata | a_latlng | b_latlng | distance_km
------------------+--------+------------------+--------+--------------------+--------------------+-------------
Australia | JHQ | Australia | WSY | -20.2772,+148.7556 | -20.2761,+148.7550 | 0.14
Papua New Guinea | NDN | Papua New Guinea | KGW | -9.1436,+147.6842 | -9.1359,+147.6694 | 1.83
Papua New Guinea | KGW | Papua New Guinea | EFG | -9.1359,+147.6694 | -9.1538,+147.6598 | 2.24
Rwanda | GYI | Congo (Kinshasa) | GOM | -1.6772,+29.2589 | -1.6708,+29.2385 | 2.38
Papua New Guinea | NDN | Papua New Guinea | EFG | -9.1436,+147.6842 | -9.1538,+147.6598 | 2.92
Papua New Guinea | BNM | Papua New Guinea | KGW | -9.1078,+147.6667 | -9.1359,+147.6694 | 3.13
Virgin Islands | SPB | Virgin Islands | STT | +18.3386,-64.9407 | +18.3373,-64.9734 | 3.46
United States | SDM | Mexico | TIJ | +32.5723,-116.9800 | +32.5411,-116.9700 | 3.59
French Guiana | LDX | Suriname | ABN | +5.4831,-54.0344 | +5.5127,-54.0501 | 3.71
Papua New Guinea | BNM | Papua New Guinea | NDN | -9.1078,+147.6667 | -9.1436,+147.6842 | 4.40
```
140 metrų atstumu esantys JHQ ir WSY oro uostai Australijoje atrodo kaip [tas
pats objektas][10]. `NDN` ir `KGW` atrodo kaip du [nupjautos žolės
ruožai, skirti nusileisti lėktuvams][4], užskaitysime! Ketvirtosios vietos
laimėtojus tarp Ruandos ir Kongo [skiria 2.38 km][8], ir tai jau tikri nemaži
oro uostai.
**Aukščiausiai virš jūros lygio esantys oro uostai?**
```
SELECT
iata,
name,
country,
to_char(st_z (geom), '9999') AS altitude_m
FROM
airports
ORDER BY
altitude_m DESC
LIMIT 10;
iata | name | country | altitude_m
------+----------------------------------------+---------+------------
DCY | Daocheng Yading Airport | China | 4411
BPX | Qamdo Bangda Airport | China | 4334
KGT | Kangding Airport | China | 4280
NGQ | Ngari Gunsa Airport | China | 4274
LPB | El Alto International Airport | Bolivia | 4071
POI | Capitan Nicolas Rojas Airport | Bolivia | 3936
YUS | Yushu Batang Airport | China | 3906
\N | Copacabana Airport | Bolivia | 3838
JUL | Inca Manco Capac International Airport | Peru | 3826
GMQ | Golog Maqin Airport | China | 3787
```
**Žemiausiai po jūros lygiu esantys oro uostai?**
```
SELECT
iata,
name,
country,
to_char(st_z (geom), 'FMSG999.00') AS altitude_m
FROM
airports
WHERE
iata != '\N'
ORDER BY
st_z (geom) ASC
LIMIT 10;
iata | name | country | altitude_m
------+--------------------------------------+---------------+------------
MTZ | Bar Yehuda Airfield | Israel | -385.88
EIY | Ein Yahav Airfield | Israel | -49.99
TRM | Jacqueline Cochran Regional Airport | United States | -35.05
GUW | Atyrau Airport | Kazakhstan | -21.95
RZR | Ramsar Airport | Iran | -21.34
ASF | Astrakhan Airport | Russia | -19.81
NSH | Noshahr Airport | Iran | -18.59
IPL | Imperial County Airport | United States | -16.46
NJK | El Centro NAF Airport (Vraciu Field) | United States | -12.80
RAS | Sardar-e-Jangal Airport | Iran | -12.19
```
Aukštai ir žemai esantiems oro uostams turbūt komentarų daug nereikia. Tiesa,
abejose kategorijose turime aiškias šalis-lyderes.
**Arčiausiai ašigalių esantys oro uostai?**
Čia nusižengsime iki šiol buvusiai taisyklei filtruoti oro uostus tik su IATA kodais. Jūsų malonumui:
```
SELECT
name,
country,
to_char(st_y (geom), 'FMSG999.0000') || ',' || to_char(st_x (geom), 'FMSG999.0000') AS a_latlng
FROM
airports
WHERE
gid != 13011
ORDER BY
abs(st_y (geom)) DESC
LIMIT 15;
name | country | a_latlng
----------------------------------+------------+--------------------
South Pole Station Airport | Antarctica | -90.0000,+.0000
Alert Airport | Canada | +82.5178,-62.2806
Nagurskoye | Russia | +80.8032,+47.6636
Eureka Airport | Canada | +79.9947,-85.8142
Ny-Ålesund Airport (Hamnerabben) | Svalbard | +78.9275,+11.8743
Pyramiden Heliport | Norway | +78.6523,+16.3372
Svalbard Airport, Longyear | Norway | +78.2461,+15.4656
McMurdo Station Pegasus Field | Antarctica | -77.9634,+166.5250
Svea Airport | Svalbard | +77.8969,+16.7250
Williams Field | Antarctica | -77.8674,+167.0570
McMurdo Station Ice Runway | Antarctica | -77.8540,+166.4690
Siorapaluk Heliport | Greenland | +77.7865,-70.6387
Qaanaaq Airport | Greenland | +77.4886,-69.3887
Thule Air Base | Greenland | +76.5312,-68.7032
Grise Fiord Airport | Canada | +76.4261,-82.9092
```
**Atstumas tarp šiauriausio ir piečiausio oro uosto?**
```
SELECT
to_char(
st_distance (
(SELECT geom FROM airports WHERE name = 'South Pole Station Airport'),
(SELECT geom FROM airports WHERE name = 'Alert Airport'),
TRUE
)/1000,
'99999.99') AS km;
km
-----------
19168.26
```
Pabaigai
--------
PostGis prie pažįstamos ir galingos PostgreSQL sąsajos suteikia erdvines
[funkcijas, duomenų tipus ir indeksavimo galimybes][9]. Jau žinant PostgreSQL,
importuoti erdvinius duomenis ir pradėti juos analizuoti reikia tikrai ne daug.
Užduotys susidomėjusiam skaitytojui:
* Kodėl artimiausių oro uostų užklausoje naudojome [<->][5], o
tolimiausių -- [`st_distance`][6]?
* Kokį atstumą skristume aplink žemę Vilniaus platuma?
* Kiek kartų reikia nuskristi United Economy klase aplink žemę Vilniaus
platuma, kad uždirbtume [nemokamus pusryčius][7]?
[1]: https://en.wikipedia.org/wiki/International_Air_Transport_Association_code
[2]: https://github.com/motiejus/stud/tree/master/MTM/task4-straipsnis
[3]: https://openflights.org/data.html
[4]: https://goo.gl/maps/RD3d9fsH8NwzAnsYA
[5]: https://postgis.net/docs/geometry_distance_knn.html
[6]: https://postgis.net/docs/ST_Distance.html
[7]: https://www.united.com/ual/en/us/fly/mileageplus/premier/full-premier-benefits-chart.html
[8]: https://goo.gl/maps/3usBcUHDWnefVmab6
[9]: https://postgis.net/docs/reference.html
[10]: https://goo.gl/maps/T6WQhT2FDUdymnRB9

File diff suppressed because it is too large Load Diff

View File

@@ -0,0 +1,36 @@
-- schema
CREATE TABLE airports (
gid SERIAL NOT NULL PRIMARY KEY,
name TEXT,
city TEXT,
country TEXT,
iata TEXT,
icao TEXT,
geom GEOMETRY,
latitude DOUBLE PRECISION,
longitude DOUBLE PRECISION,
altitude DOUBLE PRECISION,
timezone TEXT,
dst TEXT,
tz TEXT,
type TEXT,
source TEXT,
CONSTRAINT enforce_dims_geom CHECK (st_ndims(geom) = 3),
CONSTRAINT enforce_geotype_geom CHECK (geometrytype(geom) = 'POINT'::text OR geom IS NULL),
CONSTRAINT enforce_srid_geom CHECK (st_srid(geom) = 4326)
);
-- create index for faster spatial lookups
CREATE INDEX idx_geom ON airports USING GIN (geom);
-- import data from airports.dat
\copy airports(gid, name, city, country, iata, icao, latitude, longitude, altitude, timezone, dst, tz, type, source) FROM 'airports.dat' DELIMITERS ',' CSV;
-- put lat/lon/altitude to the "real" geom field
UPDATE airports
SET geom = ST_SetSRID(ST_MakePoint(longitude, latitude, altitude * 0.3048),4326);
ALTER TABLE airports DROP COLUMN latitude;
ALTER TABLE airports DROP COLUMN longitude;
ALTER TABLE airports DROP COLUMN altitude;
ALTER TABLE airports DROP COLUMN type;
ALTER TABLE airports DROP COLUMN source;

22
I/MTM/task4-straipsnis/managedb Executable file
View File

@@ -0,0 +1,22 @@
#!/bin/bash
set -xeuo pipefail
if [[ $1 == init ]]; then
mkdir -p db && initdb db
pg_ctl -D db -l db/logfile start
psql postgres \
-c 'CREATE DATABASE airportgames;'
psql -d airportgames \
-c 'CREATE EXTENSION postgis;'
psql -d airportgames < init.sql
fi
if [[ $1 == start ]]; then
pg_ctl -D db -l db/logfile start
fi
if [[ $1 == stop ]]; then
pg_ctl -D db -l db/logfile stop
fi

View File

@@ -0,0 +1,4 @@
toolshed ?= docker run --rm -v $(PWD):/x -w /x motiejus/toolshed
task5-recenzija.pdf: task5-recenzija.tex bib.bib
$(toolshed) latexmk -pdf $<

View File

@@ -0,0 +1,12 @@
@inproceedings {186171,
author = {Ding Yuan and Yu Luo and Xin Zhuang and Guilherme Renna Rodrigues and Xu Zhao and Yongle Zhang and Pranay U. Jain and Michael Stumm},
title = {Simple Testing Can Prevent Most Critical Failures: An Analysis of Production Failures in Distributed Data-Intensive Systems},
booktitle = {11th {USENIX} Symposium on Operating Systems Design and Implementation ({OSDI} 14)},
year = {2014},
isbn = { 978-1-931971-16-4},
address = {Broomfield, CO},
pages = {249--265},
url = {https://www.usenix.org/conference/osdi14/technical-sessions/presentation/yuan},
publisher = {{USENIX} Association},
month = oct,
}

View File

@@ -0,0 +1,135 @@
\documentclass{article}
\usepackage[L7x,T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{csquotes}
\usepackage[english]{babel}
\usepackage[style=authoryear]{biblatex}
\addbibresource{bib.bib}
\usepackage{hyperref}
\usepackage{caption}
\usepackage{subcaption}
\title{
Research Methodology -- Fifth exercise\\ \vspace{4mm}
Critical evaluation of scientific work
}
\author{Motiejus Jakštys}
\date{\today}
\begin{document}
\maketitle
\section{Introduction}
\cite{186171} analyzed 198 randomly selected failures in popular distributed
systems, and classified the reasons for each failure. This is one of the most
interesting findings:
\begin{figure}[h]
\centering
\begin{subfigure}[b]{0.7\textwidth}
\blockquote[\cite{186171}] {
Almost all (92\%) of the catastrophic system failures are the result of
incorrect handling of non-fatal errors explicitly signaled in software.
}
\caption{Simple and powerful observation about bugs in distributed systems.}
\label{fig:quote-errors}
\end{subfigure}
\end{figure}
We will review the paper and answer the following questions:
\begin{enumerate}
\item What kind of study is this? Theoretical, strategic, applied, or
experimental?
\item What is the main purpose of the research task (descriptive,
explanatory, correlative, prognostic, prescriptive, or exploratory?
\item What strategies have been applied? Qualitative, quantitative or
mixed?
\item Do the findings adequately reflect the results?
\item Has the scientific method been applied properly?
\item Are the findings based on the research findings described in the
text?
\item Can the study be repeated, is there sufficient information?
\item Did the study create new knowledge? Is there practical value?
\end{enumerate}
\section{Structure overview}
\subsection{Kind of study}
The paper is strategic, applied:
\begin{description}
\item[Strategic:] authors have developed an artifact \texttt{Aspirator}
which helps software maintainers find certain classes of bugs. What is
more, they provided new knowledge, like in the quote above.
\item[Applied:] the artifact of the work, \texttt{Aspirator}, can be
applied by other software developers looking for similar classes of
bugs.
\end{description}
\subsection{Purpose of the research task}
The research task is descriptive and correlative: given a well-understood
situation of distributed systems fail catastrophically, researchers are finding
common reasons for failures, and developing tools to mitigate them.
Conclusions and suggestions are prescriptive: the researchers are warning
engineers against common failures, and suggesting tools to mitigate them.
\subsection{Applied Strategies}
The task is mixed:
\begin{description}
\item[Quantitative:] researchers are analyzing and classifying a large
number of bugs.
\item[Qualitative:] each bug requires careful analysis in order to classify
it and make interesting conclusions.
\end{description}
\subsection{Do findings reflect the purpose and results?}
\label{sec:findings-purpose-result}
Research findings are derived directly from the purpose and research results.
Namely, the researchers set out to find the most common reasons for
catastrophic failures in distributed systems. They found them, classified them,
and gave suggestions for future generations of distributed systems developers.
\subsection{Scientific Method and reproducibility}
Scientific methodc is empirical: given 198 randomly selected bugs,
researchers went to classify them using predefined classification rules and
techniques.
Classification methods and research methodology were clearly described in the
introduction, in a way anyone with sufficient engineering background could set
out to re-classify the bugs.
Given that, the actual referenced bugs and behaviours were not listed in the
article, therefore \textbf{it is impossible to replicate this exact study}.
\subsection{Practical value}
For a software engineer building distributed systems, the conclusion alone
(\ref{fig:quote-errors}) is already eye-opening for making our own robust
distributed systems.
\texttt{Aspirator} looks like a promising tool for code bases that were
developed without non-fatal error handling in mind. For engineers that are
working on new code and are disciplined, can take their time to write tests for
failure conditions (i.e. not in pressure to ship code), knowledge-able and read
the discussed paper, this tool will not be useful.
Even though it is important to educate existing and future generations (what the
article does very well), since life is not that great, \texttt{Aspirator} will
likely find its use in existing and new software.
\printbibliography
\end{document}

View File

@@ -0,0 +1,4 @@
toolshed ?= docker run --rm -v $(PWD):/x -w /x motiejus/toolshed
task6-thesis-project.pdf: task6-thesis-project.tex bib.bib
$(toolshed) latexmk -pdf $<

View File

@@ -0,0 +1,42 @@
@incollection{rose2017analysis,
title={Analysis of High Temperature Forecast Accuracy of Consumer Weather Forecasts from 2005-2016},
author={Rose, Bruce and Floehr, Eric},
booktitle={Technical Report},
year={2017},
publisher={Intellovations, LLC}
}
@online{verification2015,
title={Forecast Verification},
author={
Météo-France, Toulouse, France
and Purdue University, Indiana, USA
and NOAA/NWS Hydrometeorological Prediction Center, Washington DC, USA
and Paul Roebber, University of Wisconsin, USA
and Harold Brooks, Oklahoma, USA
and Barb Brown, NCAR, USA
and Environment Canada, Canada
and Deutscher Wetterdienst, Offenbach, Germany
and Beth Ebert, Bureau of Meteorology, Australia
and Chris Ferro, University of Exeter, UK
and Ian Jolliffe, University of Exeter, UK
and David Stephenson, University of Exeter, UK
and The Met Office, Exeter, UK
and ECMWF, Reading, UK
and Deutscher Wetterdienst, Offenbach, Germany
and Johannes Jenkner, University of British Columbia, Canada
and University of Munich, Munich, Germany
and Tieh-Yong Koh, Nanyang Technological University, Singapore
and Finnish Meteorological Institute, Hensinki, Finland
and Research en Prévision Numérique, Dorval, Canada
},
year={2015},
url={https://www.cawcr.gov.au/projects/verification/},
}
@online{lrs-stichiniai,
title={Dėl Stichinių, katastrofinių meteorologinių ir hidrologinių reiškinių rodiklių patvirtinimo},
author={Gediminas Kazlauskas},
year={2011},
url={https://e-seimas.lrs.lt/portal/legalAct/lt/TAD/TAIS.412088/ahwsrHHBNl},
}

View File

@@ -0,0 +1,216 @@
\documentclass{article}
\usepackage[L7x,T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{csquotes}
\usepackage[lithuanian]{babel}
\usepackage[maxbibnames=99,style=authoryear]{biblatex}
\addbibresource{bib.bib}
\usepackage{hyperref}
\usepackage{caption}
\usepackage{subcaption}
\usepackage{gensymb}
\usepackage{varwidth}
\usepackage{tikz}
\usetikzlibrary{er,positioning}
\title{
Prieinamų orų prognozių palyginimas Lietuvoje ir Baltijos šalyse \\ \vspace{4mm}
\large Mokslinių tyrimų metodologija\\
Šeštoji užduotis -- Magistrinio darbo projektas
}
\author{Motiejus Jakštys}
\date{\today}
\begin{document}
\maketitle
\newpage
\section{Santrauka}
Norėdami sužinoti oro prognozę, nežinome, kuris iš daugelio siūlomų šaltinių
yra tiksliausias. Pasitikėdami netiksliu šaltiniu rizikuojame padaryti
neefektyvius sprendimus: žemės ūkyje, infrastruktūros projektuose, arba
kasdieniame gyvenime. Šis darbas pasakys, kuri orų prognozė Lietuvoje tirtuoju
periodu buvo tiksliausia. Paviešinę šiuos rezultatus galbūt atkreipsime tiekėjų
dėmesį į jų prognozių tikslumą, ir padėsime skaičiuosiems žmonėms išsirinkti
geriausią orų prognozės tiekėją.
\section{Tyrimo problema ir tikslas}
\label{sec:problema-ir-tikslas}
Norėdami sužinoti oro prognozę, galime pasirinkti keletą šaltinių: žinios per
televiziją ar radiją, nacionalinė hidrometeorologijos tarnybos interneto
svetainė, arba vieną iš aibės pasaulinių interneto svetainių. Žmonės renkasi
pagal patogumą ir įpročius, tačiau nebūtinai jų pasirinktas šaltinis yra
objektyviai geriausias.
Kadangi orų prognozių tikslumas nėra lengvai prieinamas ir ne daug tiriamas,
įprasta rinktis pagal tai, kas žinoma ir matoma -- vartotojo sąsajos patogumas
arba anekdotiniai potyriai ("šis šaltinis dar niekada manęs neapvylė, o
tavęs?").
Šis darbas per kalendorinius metus surinks populiarių Lietuvoje šaltinių 1, 5
ir 10 dienų orų prognozes, palygins jas su faktiniais orais, ir atsakys į šiuos
klausimus:
\begin{itemize}
\item Ar orų prognozių tikslumas skiriasi tarp regionų?
\item Kuris tiekėjas tiksliausias tam tikrame regione?
\item Kuris tiekėjas tiksliausias tam tikru metų laiku?
\item Kuris tiekėjas tiksliausiai prognozuoja kritulius, minimalią
temperatūrą, maksimalią temperatūrą, vėjo greitį?
\end{itemize}
Jei pavyks surinkti duomenis iš kitų valstybių nacionalinių tiekėjų:
\begin{itemize}
\item Kiek skiriasi to paties tiekėjo orų prognozės tarp valstybių (pvz.,
meteo.pl duoda orų prognozes ir Vilniui)?
\item Kiek skiriasi "nacionalinių" tiekėjų orų prognozių patikimumas
prognozuojant orus jų pačių valstybėje? Pvz., Lietuvos, Lenkijos ir
Vokietijos?
\end{itemize}
\subsection{Medis}
\newcommand{\ent}[2]{\begin{varwidth}{3.5cm}\small \textbf{#1} #2\end{varwidth}}
\newcommand{\priezastis}{
\ent{Priežastis:}{neaišku, kuri prognozė tiksliausia}
}
\newcommand{\problema}{
\ent{Problema:}{planuojant rytojaus dieną buvo remtasi netikslia orų prognoze}
}
\newcommand{\pasekmeI}{
\ent{Pasėkmė 1:}{žemės ūkis ruošiasi sėjai, nors artimiausias kelias dienas nelis.}
}
\newcommand{\pasekmeII}{
\ent{Pasėkmė 2:}{kelininkai ruošiasi tiesti kelio atkarpą, kurioje tuo metu lis.}
}
\newcommand{\pasekmeIII}{
\ent{Pasėkmė 3:}{išėjome į žygį, ir po pietų pradėjo lyti. O išmainėme muziejų dieną į žygį.}
}
\begin{tikzpicture}[sibling distance=5cm,
every node/.style = {shape=rectangle, rounded corners,
draw, align=center,
top color=white, bottom color=blue!20}]]
\node {\priezastis}
child { node { \problema }
child { node { \pasekmeI } }
child { node { \pasekmeII } }
child { node { \pasekmeIII } }
};
\end{tikzpicture}
\section{Terminai}
Tiriant ypatingus gamtos reiškinius, svarbu juos apibrėžti. Kaip pagrindą
naudosime įstatymą 111301MISAK00D1-870 \cite{lrs-stichiniai}; mums rūpimi yra
šie:
\begin{description}
\item[Labai smarkus vėjas:] 28 m/s.
\item[Labai smarkus lietus:] 50mm/val.
\item[Kaitra] $>30\degree$ besitęsianti $\geq 3d$.
\end{description}
\section{Hipotezės}
\begin{itemize}
\item To paties tiekėjo orų prognozių efektyvumas skirtingose geografinėse
lokacijose nesikeis.
\item Skirtingų tiekėjų orų prognozių efektyvumas bus vienodas ilguoju
(metų) laikotarpiu.
\item Visi tirti orų prognozių tiekėjai vienodai gerai numatys ypatingus
gamtinius reiškinius.
\end{itemize}
\section{Tyrimo uždaviniai}
Tyrimo tikslas yra aprašytas \nameref{sec:problema-ir-tikslas}, čia paminėsime
uždavinius:
\begin{itemize}
\item Surinkti populiarius orų prognozių tiekėjus tiriamose šalyse. Tam užteks
interneto paieškos ir apklausti iki 10 žmonių.
\item Pagal prognozės tiekėjų teikiamą informaciją apibrėžti statistinės
analizės metodus. Atkreipiu dėmesį, kad analizės metodus atrinkti dabar
yra dar per anksti.
\item Aprašyti, kuriuos regionus tirsime. Tikėtina, kad tuos, kuriuose yra
meteorologinės stotelės.
\item 365 kartus atsisiųsti šias prognozes tą pačią valandą (pvz., 22:00
Lietuvos laiku):
\begin{itemize}
\item 1, 5 ir 10 dienų.
\item Maksimalios, minimalios temperatūros, vėjo greičio, kritulių kiekio.
\end{itemize}
\item Kai duomenys bus surinkti, vykdyti statistinę analizę.
\end{itemize}
\section{Mokslinė literatūra, ankstesni tyrimai}
Orų prognozių tikslumas 11 metų laikotarpyje buvo analizuotas
\cite{rose2017analysis}, tačiau buvo neskirstoma tarp regionų: išvadose buvo
visi tirti kontinentai. Šiame darbe norime skirstyti prognozių tikslumą pagal
regionus, taip pat pridėti "nacionalinius" tiekėjus.
Detali literatūros apžvalga bus pridėta tolimesnėje darbo stadijoje.
\section{Metodologinė schema (tikslumo skaičiavimo metodika)}
Prognozių patikimumas bus matuojamas dviem būdais.
\subsection{Palyginamoji (bazinė) metodika}
Kad galėtume palyginti šį darbą su \cite{rose2017analysis}, "preliminariai"
analizei naudosime tuos pačius metodus:
\begin{itemize}
\item Minimalios temperatūros paroje prognozės tikslumą.
\item Makslimalios temperatūros paroje prognozės tikslumą.
\item Kritulių kiekio prognozės tikslumą.
\end{itemize}
Kaip ir šaltinyje, metodika bus pritaikyta 1, 5 ir 10 dienų išankstinei
prognozei.
Šis palyginimas neatsako į pagrindinį darbo klausimą, nes neskirsto tarp
regionų. Tačiau šie duomenys yra vertingi palyginti, ar duomenys yra preliminariai
panašūs į ankstesnį darbą.
\subsection{Kartografinė metodika}
Bazinė metodika neatsako į šiuos įdomius klausimus:
\begin{itemize}
\item Neskirsto tarp regionų: ar tarp Lietuvos regionų orų prognozės
tikslumas skiriasi?
\item Kuris šaltinis patikimiausiai nustato svarbius meteorologinius
reiškinius (tarkime, $>100mm$ kritulių per 24 val.)?
\item Kadangi patikimumą skirstome per regionus ir laiką, kaip galime tai
informatyviai parodyti žemėlapyje?
\end{itemize}
Analizuoti ir atvaizduoti tikslumą erdvėje naudosime metodus, aprašytus
\cite{verification2015}.
Matematiniai modeliai, padėsiantys paskaičiuoti svarbių meteorologinių
reiškinių tikslumą, taip pat aprašyti \cite{verification2015}.
\section{Apibendrinimas}
Šis darbas ištirs komercinių oro tiekėjų orų prognozių patikimumą laike ir
erdvėje: minimalią, maksimalią temperatūrą, paros kritulių kiekį, ir prognozių
gebėjimą nuspėti ypatingus gamtinius reiškinius. Palyginus tyrimo rezultatus su
\cite{rose2017analysis}, taip pat tirsime ir prognozių efektyvumą per
geografinę lokaciją.
\printbibliography
\end{document}

View File

@@ -0,0 +1,4 @@
toolshed ?= docker run --rm -v $(PWD):/x -w /x motiejus/toolshed
task7-thesis-plan.pdf: task7-thesis-plan.tex bib.bib
$(toolshed) latexmk -pdf $<

View File

@@ -0,0 +1,44 @@
@incollection{rose2017analysis,
title={Analysis of High Temperature Forecast Accuracy of Consumer Weather Forecasts from 2005-2016},
author={Rose, Bruce and Floehr, Eric},
booktitle={Technical Report},
year={2017},
publisher={Intellovations, LLC}
}
@online{motiejus-task6,
title={Šeštoji užduotis -- Magistrinio darbo projektas},
author={Motiejus Jakštys, Vilniaus Universitetas},
year={2019},
month={12},
language={Lithuanian},
url={https://github.com/motiejus/stud/blob/master/MTM/task6-thesis-project/task6-thesis-project.tex},
}
@online{verification2015,
title={Forecast Verification},
author={
Météo-France, Toulouse, France
and Purdue University, Indiana, USA
and NOAA/NWS Hydrometeorological Prediction Center, Washington DC, USA
and Paul Roebber, University of Wisconsin, USA
and Harold Brooks, Oklahoma, USA
and Barb Brown, NCAR, USA
and Environment Canada, Canada
and Deutscher Wetterdienst, Offenbach, Germany
and Beth Ebert, Bureau of Meteorology, Australia
and Chris Ferro, University of Exeter, UK
and Ian Jolliffe, University of Exeter, UK
and David Stephenson, University of Exeter, UK
and The Met Office, Exeter, UK
and ECMWF, Reading, UK
and Deutscher Wetterdienst, Offenbach, Germany
and Johannes Jenkner, University of British Columbia, Canada
and University of Munich, Munich, Germany
and Tieh-Yong Koh, Nanyang Technological University, Singapore
and Finnish Meteorological Institute, Hensinki, Finland
and Research en Prévision Numérique, Dorval, Canada
},
year={2015},
url={https://www.cawcr.gov.au/projects/verification/},
}

View File

@@ -0,0 +1,101 @@
\documentclass{article}
\usepackage[L7x,T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{csquotes}
\usepackage[lithuanian]{babel}
\usepackage[maxbibnames=99,style=authoryear]{biblatex}
\addbibresource{bib.bib}
\usepackage{hyperref}
\usepackage{caption}
\usepackage{subcaption}
\title{
Prieinamų orų prognozių palyginimas Lietuvoje ir Baltijos šalyse \\ \vspace{4mm}
\large Mokslinių tyrimų metodologija\\
Septintoji užduotis -- Magisto darbo tyrimų planas
}
\author{Motiejus Jakštys}
\date{\today}
\begin{document}
\maketitle
\newpage
\section{Planuojamo tyrimo aktualumas, originalumas, teorinė ir praktinė reikšmė}
\subsection{Aktualumas}
Kaip aprašyta \cite{motiejus-task6}, darbas aktualus žmonėms ir industrijoms,
kurie/kurios vykdo veiklą lauke šio darbo tiriamoje teritorijoje.
\subsection{Originalumas}
\cite{rose2017analysis} ištyrė orų prognozių tiekėjus ir pateikė išvadas per
tiekėją, imdami globalius duomenis. Tačiau šis tyrimas nenurodo, kaip keičiasi
prognozių tikslumas tarp skirtingų regionų. Deja, duomenys nėra viešai
prieinami.
Šis darbas bus aktualus norint įvertinti prognozės tikslumą konkrečiame regione.
\section{Tyrimo uždaviniai}
Darbas susideda iš kelių dalių:
\begin{description}
\item[Duomenų surinkimas] iš duomenų portalų. Kadangi norime įvertinti
kalendorinių metų ciklą, duomenis reikės rinkti iš kelių bent vieną
kartą per dieną iš kelių tiekėjų visus metus.
\item[Duomenų apdorojimas:] portaluose prognozės pateikiamos skirtingu
formatu. Kad galėtume prognozes lyginti, duomenis reikia suvienodinti.
\item[Analizė] prasidės, kai kalendorinių metų duomenys bus surinkti
ir susisteminti. Kaip paminėta \cite{motiejus-task6}, naudosime "naivų"
metodą palyginimui su \cite{rose2017analysis}, ir erdvinius metodus iš
\cite{verification2015}.
\item[Išvados:] kuri prognozės sistema patikimiausia? Kiek patikimumas
priklauso nuo regiono? Kurie tiekėjai duoda patikimiausius prognozės
aspektus?
\item[Vizualizacija:] kokį pateikti žemėlapį, geriausiai perteikiantį
analizės rezultatus ir rekomendacijas?
\end{description}
\section{Laukiami rezultatai}
Gauti rezultatai padės atsakyti į hipotezes:
\begin{itemize}
\item ar orų viešai prieinamų oro prognozių patikimumas svyruoja tarp
regionų?
\item kuris orų prognozės tiekėjas geriausias? Bendrai? Žiemą? Vasarą?
Lietui? Vėjui?
\end{itemize}
\section{Tyrimo tipas, reikalingi ištekliai}
Tyrimas yra {\textbf prognostinis kiekybinis}: pagal praeities orų prognozių
rezultatus ekstrapoliuojame, kurie tiekėjai kuriuose regionuose orus numato
geriausiai. Kiekybinis, nes aiškinamasi ne priežastys, o rezultatas.
Kadangi tyrimas remsis duomenimis iš reguliariai atsisiunčiamų viešai priimamų
šaltinių, tokie ir bus ištekliai. Svarbu, kad duomenų surinkimo metu
interneto svetainės, iš kurių bus siunčiami duomenys, išliktų prieinamos, ir
surenkamų duomenų formatas iš esmės nepasikeistų.
\section{Stiprybės ir silpnybės}
Duomenų kiekis bus toks, kad surinkimą ir analizę reikės automatizuoti.
{\textbf Stiprybė}: esu programuotojas ir mokėsiu tai daryti.
Silpnybė: tiriu meteorologinius reiškinius, tačiau nesu meteorologas ir neturiu
net meteorologijos pagrindų. Tačiau darbo vadovas yra ekspertas meteorologas.
\section{Naudojami pradiniai duomenys ir pagrindinės numatomų taikyti metodų grupės}
Pradiniai duomenys -- iš oro prognozių tiekėjų. Tyrimo pradžioje atsisiųsiu
kelias prognozes, kad galėčiau įvertinti formatą ir pradėti vykdyti
nesudėtingas analizes.
\printbibliography
\end{document}