Portál AbcLinuxu, 6. května 2025 09:13
namespace { template<typename CharType = wchar_t> std::basic_istream<CharType>& operator>>(std::basic_istream<CharType>& inputStream, std::basic_string<CharType>& line) { std::getline(inputStream, line); return inputStream; } } template<typename CharType = char> auto ReadLines(std::wstring path) { auto inputStream = new std::ifstream(path); using iterator = std::istream_iterator<std::basic_string<CharType>>; auto begin = std::shared_ptr<iterator>( new iterator(*inputStream), [inputStream](auto* iterator) { delete iterator; delete inputStream; } ); return begin; }Je toto správne riešenie? Alebo na to idem zle? Lebo fungovať mi to funguje. Ak viete o niečom priamočiarejšom tak sem s tým. Ďakujem.
auto begin = ReadLines(L"c:\test\newFile21.txt"); for (auto it = *begin; it != std::istream_iterator<std::string>(); ++it) { std::cout << ":" << *it << "n"; }
#include <fstream> #include <iostream> #include <stdexcept> template <typename T> void read_lines(const std::string &path, T &&handler) { std::ifstream s{}; s.open(path); if (!s.is_open()) throw std::runtime_error{"Cannot open file"}; std::string str{}; while (std::getline(s, str).good()) handler(str); } int main() { try { read_lines("abc.txt", [](const std::string &s) { std::cout << s << std::endl; }); } catch (const std::runtime_error &ex) { std::cout << ex.what() << std::endl; } return 0; }
Začal bych od jednoduchého příkladu — implicitní iterace po slovech. To se zařídí třeba takhle:
#include <fstream> #include <iostream> #include <iterator> #include <string> namespace { template<typename C> struct ifstream_iterable { ifstream_iterable(const std::string &path) : stream_{path} {} auto begin() { return iterator{stream_}; } auto end() { return iterator{}; } private: typedef std::istream_iterator<std::basic_string<C>, C> iterator; std::basic_ifstream<C> stream_; }; } // namespace int main() { for (auto &w : ifstream_iterable<wchar_t>{"/proc/cpuinfo"}) std::wcout << w << std::endl; }
To bychom měli. Teď je otázka, jak z toho^^^ udělat iteraci po řádcích. Předně pár poznámek k tématu:
>>
je mírně špatně v mezích zákona, protože deklarace je hodně podobná této deklaraci v headeru <string>
, což sice na první pohled nevadí, ale na druhý pohled tam hraje roli až příliš mnoho složitých detailů kolem pravidel pro hledání identifikátorů. Drobná změna standardu a/nebo (kni)hovny může vést k tomu, že operátor se buď vůbec nepoužije, nebo začne být v konfliktu s operátory z (kni)hovny. Drobnou modifikací se mi podařilo vyrobit (proti)příklad, kdy clang++
i g++
kód přeloží bez varování, ale g++
„přetížený“ operátor použije, zatímco clang++
nikoliv.std::string
(což je sice technicky možné, ale z hlediska kompatibility a udržovatelnosti kódu je vhodné se takových nápadů vyvarovat)Co tedy podniknout? Třeba tohle:
#include <fstream> #include <iostream> #include <iterator> #include <string> #include <utility> namespace { template <typename C> struct line { std::basic_istream<C>& operator <<(std::basic_istream<C> &stream) { std::getline(stream, str_); return stream; } operator const std::basic_string<C>&() const & { return str_; } operator std::basic_string<C>&() & { return str_; } // zde se nepoužije operator std::basic_string<C>() && { return std::move(str_); } // -dtto- private: std::basic_string<C> str_; }; template <typename C> std::basic_istream<C>& operator >>(std::basic_istream<C> &stream, line<C> &str) { str << stream; return stream; } template<typename C> struct ifstream_iterable { ifstream_iterable(const std::string &path) : stream_{path} {} auto begin() { return iterator{stream_}; } auto end() { return iterator{}; } private: typedef std::istream_iterator<line<C>, C> iterator; std::basic_ifstream<C> stream_; }; } // namespace int main() { for (const std::wstring &l : ifstream_iterable<wchar_t>{"/proc/cpuinfo"}) std::wcout << l << std::endl; }
Tohle^^^ nedědí od základních typů, nevyvolává příliš mnoho nespecifikovaných rohových případů, nepoužívá kámoše a vystačí si s jednou třídou (dělnickou), kterou lze konvertovat na odpovídající string
. (Pro složitější konverze do jiného API si lze napsat deduction guides, ale to už je jiné téma. V této podobě se kód přeloží s C++ 14, 17 i 20, zatímco s deduction guides by vyžadoval minimálně C++17.)
Ještě závěrem dodám (a předejdu tak, doufám, některým komentářům), že někteří lidé mají utkvělou špatnou představu o sousloví return std::move(...);
— myslí si, že něco takového nedává smysl a že by to nemělo existovat. Samozřejmě se mýlí, jak jinak; tady jsou k tomu předdrobnosti i podrobnosti.
A když nad tím znova přemýšlím (což rozhodně nedělám často), čitelnější to bude bez toho nestandardního operátoru <<
, který nijak neinteraguje s (kni)hovnou a jenom všeho všudy mate čtenáře (včetně mě). Takže raději třeba takto:
#include <fstream> #include <iostream> #include <iterator> #include <string> #include <utility> namespace { template <typename C> struct line { operator const std::basic_string<C>&() const & { return str_; } operator std::basic_string<C>&() & { return str_; } operator std::basic_string<C>() && { return std::move(str_); } // nepoužito private: std::basic_string<C> str_; }; template <typename C> std::basic_istream<C>& operator >>(std::basic_istream<C> &stream, line<C> &str) { std::getline(stream, static_cast<std::basic_string<C>&>(str)); return stream; } template<typename C> struct ifstream_iterable { ifstream_iterable(const std::string &path) : stream_{path} {} auto begin() { return iterator{stream_}; } auto end() { return iterator{}; } private: typedef std::istream_iterator<line<C>, C> iterator; std::basic_ifstream<C> stream_; }; } // namespace int main() { for (const std::wstring &l : ifstream_iterable<wchar_t>{"/proc/cpuinfo"}) std::wcout << l << std::endl; }
Ale ak pri smartpointeroch používate deleter tak sa použitiu delete nevyhnete.
To je sice pravda, ale právě nadužívání dynamické alokace je u C++ poměrně častá chyba. Zrovna třeba statement delete iterator;
není dobrý nápad (a kdekoho přiměje zvednout obočí), protože iterátor má být (a většinou je) malý kousek dat (něco jako 16 B, dejme tomu), který se dá a má předávat všude hodnotou. (Samozřejmě kromě případu, kdy je potřeba z více míst měnit jeden iterátor, tj. mít něco jako dvouhvězdičkový pointer.)
Ještě bych poznamenal, jen tak pro úplnost, že příklad v dotazu by byl lepší s použitím std::unique_ptr
místo std::shared_ptr
. Zatímco std::unique_ptr
je jednoduchý zapouzdřený pointer, který vyjadřuje exkluzivní vlastnictví a vlastní z jednoho kontextu jeden kousek dat, std::shared_ptr
je složitá mašinerie s atomickým reference-countingem. Uvnitř v implementaci std::shared_ptr
neukazuje přímo na data, která spravuje, nýbrž na svou vlastní dynamickou strukturu, ve které má (kromě pointeru) také atomické počítadlo referencí a pár dalších vychytávek. (Dlužno navíc dodat, v souvislosti s atomickým počítadlem, že jedna atomická instrukce může stát čas srovnatelný s řádově tisícem sčítání.) Dá se říct, že std::shared_ptr
je v jistém smyslu thread-safe, byť s omezeními:
std::shared_ptr
, každou z jiného vlákna, lze používat paralelně zcela bez omezení.std::shared_ptr
několika vlákny (například rozumně atomické přiřazení toho sdíleného pointeru) ovšem samo od sebe atomické není; k tomu slouží specializace std::atomic<std::shared_ptr<...>>
.Zkrátka a dobře (nebo zdlouha a špatně, teď nevím),
std::unique_ptr
místo std::shared_ptr
, je to jasná volba, zejména z hlediska efektivity a jednoznačnosti vlastnictví objektů. Atomický reference-counting je potřebný jenom velmi zřídka, nikoliv zhusta.
Tiskni
Sdílej:
ISSN 1214-1267, (c) 1999-2007 Stickfish s.r.o.